百度大脑语音能力引擎论坛在京召开,现场,百度语音首席架构师贾磊正式提出基于复数CNN网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,消除学科间壁垒,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法,错误率降低超过30%。
这项技术无需任何数字信号处理和语音识别学科的先验假设,复数CNN网络内存占用少于200K,可以内置到百度鸿鹄芯片内部。利用进场数据和纯粹依靠仿真数据,就可以获得足量的远场训练数据,整个过程是从原始多麦克信号到识别文字的一个端到端训练,整个优化过程只有字错误率两集一个优化准则。
百度语音首席架构师贾磊表示,“这项技术完成了数字信号处理和语音识别这两个领域的技术革命,用端到端一个声学模型,不需要任何领域行业的支持,解决两个跨领域的语音识别问题。”
百度AI开放平台,是面向企业、机构、创业者、研发者,将百度在人工智能领域积累的技术以API或SDK等形式对外共享的在线平台。提供全球前沿的语音识别与合成、OCR、人脸识别、NLP等数十项服务,开放DuerOS、Apollo两大行业生态,享应用场景和解决方案,帮您提升竞争力,开创未来。
提供全球精良的语音、图像、NLP等多项人工智能技术,开放对话式人工智能系统、智能驾驶系统两大行业生态,共享AI领域新的应用场景和解决方案,您提升竞争力。
深圳是一座高速发展的城市,马上要成为中国、乃至于整个亚洲的科技、金融中心,在这里有着许许多...
跨境支付正在变得越来越流行,但凡有过跨境购物、出国旅游或留学的人,或多或少都会接触过。但是...
互联网现如今迎来了内容创业的风潮,付费社区、音频问答、在线课程等知识付费产品表现抢眼,喜马...
企业大数据查询工具大搜罗,买购网为您提供政府开放数据平台、企业信用信息、知识产权查询、互联...
在财富世界500强中,来自互联网行业的亚马逊、Alphabet公司、京东、阿里巴巴、腾讯是...
提起硅谷,你最先想到什么?美国、高科技、创业,还是世界的中心?这些都没错,硅谷之所以成为硅...