百度大脑语音能力引擎论坛举行 发布智能语音交互新技术

本文章由注册用户 闻罗天下 上传提供 评论 发布 纠错/删除 版权声明 0

百度大脑语音能力引擎论坛在京召开,现场,百度语音首席架构师贾磊正式提出基于复数CNN网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,消除学科间壁垒,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法,错误率降低超过30%。

  • 这项技术无需任何数字信号处理和语音识别学科的先验假设,复数CNN网络内存占用少于200K,可以内置到百度鸿鹄芯片内部。利用进场数据和纯粹依靠仿真数据,就可以获得足量的远场训练数据,整个过程是从原始多麦克信号到识别文字的一个端到端训练,整个优化过程只有字错误率两集一个优化准则。

    百度语音首席架构师贾磊表示,“这项技术完成了数字信号处理和语音识别这两个领域的技术革命,用端到端一个声学模型,不需要任何领域行业的支持,解决两个跨领域的语音识别问题。”

  • 百度AI品牌介绍
行业推荐品牌

百度AI开放平台,是面向企业、机构、创业者、研发者,将百度在人工智能领域积累的技术以API或SDK等形式对外共享的在线平台。提供全球前沿的语音识别与合成、OCR、人脸识别、NLP等数十项服务,开放DuerOS、Apollo两大行业生态,享应用场景和解决方案,帮您提升竞争力,开创未来。

提供全球精良的语音、图像、NLP等多项人工智能技术,开放对话式人工智能系统、智能驾驶系统两大行业生态,共享AI领域新的应用场景和解决方案,您提升竞争力。

推荐阅读
网站提醒和声明
本站为注册用户提供信息存储空间服务,非“MAIGOO编辑”、“MAIGOO榜单研究员”、“MAIGOO文章编辑员”上传提供的文章/文字均是注册用户自主发布上传,不代表本站观点,版权归原作者所有,如有侵权、虚假信息、错误信息或任何问题,请及时联系我们,我们将在第一时间删除或更正。 申请删除>> 纠错>> 投诉侵权>> 网页上相关信息的知识产权归网站方所有(包括但不限于文字、图片、图表、著作权、商标权、为用户提供的商业信息等),非经许可不得抄袭或使用。
提交说明: 快速提交发布>> 提交资讯帮助>> 注册登录>>
相关推荐
一图读懂人工智能 什么是人工智能 人工智能的应用
21世纪,不少人坚信人工智能是引领第四次工业革命的关键,亚马逊、谷歌、微软、阿里、百度等全球性大企业也早就把人工智能调整为企业核心战略,那么人工智能到底是什么?今天,我们一起来揭开人工智能神秘的面纱。
人工智能 一图读懂 ★★★
3061 114
ChatGPT收费吗 chatgpt使用技巧
这几个月,全世界人民把ChatGPT玩疯了,现在科技圈没有什么比ChatGPT更火了。自2022年11月30日开放注册以来,全球用户量已破亿,日峰值请求数也已达到数亿级别。那么这么火爆的ChatGPT是收费的吗?chatgpt有什么使用技巧呢?使用chatgpt有什么常见问题呢?下面小编就来为大家解答这些问题,一起来看看吧。
2024年十大科技前瞻 2024年科技风向标 2024科技趋预测
科技是第一生产力,影响着各个产业的发展和更新。国内外多家媒体和研究机构,已公布2024年科技发展趋势报告,针对新能源汽车、生成式AI、低轨卫星通信、超级计算机、半导体、人形机器人、脑机接口技术、电动垂直起降飞行器等行业或技术作出了分析和预测。下面Maigoo小编就带大家看看2024年十大科技趋势榜单。
人工智能 科技/发明 ★★★
165 2
数字人是什么意思 数字人技术的原理和应用
数字人,是近些年在网络上经常会看到的一个词汇,那么数字人是什么意思呢?数字人是运用数字技术创造出来的、与人类形象接近的数字化人物形象。数字人应用广泛,互联网、金融、教育、传媒等领域纷纷推出数字人,用于品牌营销、提升经济效益等。不过还有很多朋友对于数字人的了解甚微,那么下面这篇文章就会带大家详细了解数字人的相关知识。
数字人 人工智能 ★★★
178
AI教育浪潮兴起 或将颠覆传统教育?
人工智能已成为不可逆的发展趋势,而“人工智能+教育”深度融合也已逐渐开启,全球已经兴起了一股人工智能教育的浪潮。那么, AI 能否赋能教育?在 AI 的推动下,传统教育又会有什么样的改变?