数码录音笔工作原理
数码录音笔通过对声音的模拟信号的采样、编码,将模拟信号通过数模转换器转换为数字信号,并进行压缩后进行存储。
智能录音笔工作原理
语音交互,只需要短短几秒钟便可翻译出文字。所谓语音转换成文字用到了语音交互中一项ASR技术。
建立声学模型:由于每个人发音、语调、语速等各不相同,需要将同一个单词或汉字让不同用户录取,以便机器识别更多的人。声学模型建立过程需要录入大量的原始用户声音,以从中提取特征建立声学模型数据库。
建立语言模型:同声学模型,也需要大量文字信息的储存。语言模型可以对声学模型进行匹配与调整,让正确率尽可能提高,语句更加通顺。
语音识别:有前两步作为基础的情况下,最终形成的数据库存储在设备本地或云端,再进行实时语音识别。将用户的语音输入进行编码和特征提取,将提取到的特征拿到声学模型库中去查询,得到单个的单词或汉字;然后再拿到语言模型库中去查询,得到最匹配的单词或汉字。