阿里巴巴发布语音合成技术KAN-TTS,基于KAN-TTS技术的合成语音可将该数据提高到97%以上。融合了端到端TTS技术和传统TTS技术,从多个方面改进了语音合成。普通用户定制“AI声音”的门槛更低了。
阿里巴巴发布语音合成技术KAN-TTS,据介绍,该技术可大幅提高合成语音与真人发声的相似度,并将语音合成定制成本降低10倍以上。
KAN-TTS技术由达摩院机器智能实验室自主研发。阿里方面称,基于KAN-TTS技术的合成语音可将该数据提高到97%以上。
据悉,KAN-TTS深度融合了端到端TTS技术和传统TTS技术,从多个方面改进了语音合成。传统语音合成定制需要10小时以上的数据录制和标注,对录音人和录音环境要求很高。从启动定制到最终交付,项目周期长成本高。
而阿里利用Multi-Speaker Model与Speaker-aware Advanced Transfer Learning相结合的方法,将语音合成定制周期压缩3倍以上。也就是说,用1小时有效录音数据和不到两个月制作周期,就能完成一次标准TTS定制。
此外,这使得普通用户定制“AI声音”的门槛更低。只需手机录音十分钟,就能获得与录制声音高度相似的合成语音。
阿里巴巴集团正式在香港交易所挂牌上市,成为首个同时在美股和港股上市的中国互联网公司。这个行...
杭州2022年第19届亚运会组委会宣布,阿里巴巴成为杭州亚运会官方合作伙伴。作为创新技术,...
阿里巴巴集团正式在港交所挂牌上市,开盘187港元,阿里巴巴此次发行5亿股新股,另有7500...
天猫、菜鸟、蚂蚁金服……不管是内部孵化,还是投资收购,阿里系的新伙伴一般都会为它想个动物的...