百度大脑语音能力引擎论坛在京召开,现场,百度语音首席架构师贾磊正式提出基于复数CNN网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,消除学科间壁垒,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法,错误率降低超过30%。
这项技术无需任何数字信号处理和语音识别学科的先验假设,复数CNN网络内存占用少于200K,可以内置到百度鸿鹄芯片内部。利用进场数据和纯粹依靠仿真数据,就可以获得足量的远场训练数据,整个过程是从原始多麦克信号到识别文字的一个端到端训练,整个优化过程只有字错误率两集一个优化准则。
百度语音首席架构师贾磊表示,“这项技术完成了数字信号处理和语音识别这两个领域的技术革命,用端到端一个声学模型,不需要任何领域行业的支持,解决两个跨领域的语音识别问题。”
百度AI开放平台,是面向企业、机构、创业者、研发者,将百度在人工智能领域积累的技术以API或SDK等形式对外共享的在线平台。提供全球前沿的语音识别与合成、OCR、人脸识别、NLP等数十项服务,开放DuerOS、Apollo两大行业生态,享应用场景和解决方案,帮您提升竞争力,开创未来。
提供全球精良的语音、图像、NLP等多项人工智能技术,开放对话式人工智能系统、智能驾驶系统两大行业生态,共享AI领域新的应用场景和解决方案,您提升竞争力。
中国互联网协会发布了《中国互联网企业综合实力指数(2024)》报告,同时公布了2024年中...
中国互联网络信息中心发布了第54次《中国互联网络发展状况统计报告》,《报告》显示,截至20...
中国连锁经营协会与德勤合作发布了“2024年中国网络零售TOP100榜单”。榜单按照企业2...
互联网行业协会围绕政府的发展战略和社会经济需要,为企业服务,对我国互联网行业的发展起到了促...
财富中文网发布了“2024年《财富》中国500强排行榜”。榜单显示,此次《财富》中国500...
福建省互联网协会发布了2024年福建省互联网综合实力前50家企业榜单,上榜企业2023年度...