国泰投资欧洲家庭能源解决方案提供商Beem
06-17
近日,元璟投后公司Spichi的DUI平台上线了“单人千声”功能。
《千声万声》利用深度神经网络对说话人的音色进行建模,使单一音色可以同时生成涵盖多种语言和风格的语音合成声音,极大地丰富了合成语音的表现力。
与大家分享这个新功能。
“你好!” ——国语“雷吼哇!” - 粤语“好!” ——四川话人类在发展过程中形成了多种语言。
即使是同一种语言,发音也不同。
可以说,发音与十里八乡不同。
一个人会说普通话,但不一定会说方言。
具有语音交互功能的AI产品也是如此。
那么,同一种产品如何在不同地区销售,能够“入乡随俗”,说普通话、方言甚至外语呢?近日,Spichi DUI平台上线了“单人千声”功能。
《千声万声》利用深度神经网络对说话人的音色进行建模,使单一音色可以同时生成涵盖多种语言和风格的语音合成声音,极大地丰富了合成语音的表现力。
同样的人工智能产品,不同的语言:“小男孩离家,哥哥回来,当地发音不变,鬓发褪去。
”方言是一种文化,也是一种感情。
方言的差异主要体现在语音、词汇、语法等各个方面,其中发音的差异尤为突出。
方言的差异也对智能语音提出了新的要求。
在人机语音交互中,智能语音不仅需要懂普通话,还需要懂方言、外语,满足用户的多样化需求。
Spichi DUI平台最新推出的“单千声”功能推出了顶级女声楚楚和顶级男声小君两种音色。
每种音色均可合成普通话、四川话、粤语等方言,以及英语等外语,实现音色多语言功能。
目前,单机千音可应用于智能汽车、AI客服、视频配音、智能家居等场景。
在汽车语音场景中,能说方言的语音包才能赢得用户的“心”。
据统计,全球约有1万名讲粤语的人。
极速单声支持合成粤语,车内语音内置粤语导航,可以满足粤语方言地区用户的日常使用,增添人文情感。
“稀有客户、稀有客户”、“一路走、左转等待”,在银行、车站、机场等大厅,可在普通话、川语、粤语、英语等多种语言之间自由切换的智能客服??无疑将为来自世界各地的客人带来便利和亲切。
短视频随着动画IP的兴起,配音需求增加。
人们需要不同情感的合成声音来表达人物的喜怒哀乐。
《斯皮奇单千音》中的顶级女声可以支持四种情绪:中性、高兴、抱歉、撒娇。
同时,用户可以根据自己的需求调节说话速度和音量,合成适合自己产品的智能语音。
迁移学习,方言和外语的快速合成。
那么,斯皮奇千音为何能够快速合成各种方言、不同语言的语音呢?这就需要用到迁移学习技术。
迁移学习是一种从以前的任务中学习知识或经验并将其应用于新任务的机器学习方法。
目前,迁移学习方法大致可以分为三类:基于样本的迁移学习方法;基于特征的迁移学习方法;基于模型的迁移学习方法。
迁移学习对于人类来说很常见,人们可以应用以前学到的知识来解决新问题,以提高解决问题的效率或取得更好的结果。
例如,学习驾驶手动变速箱汽车可以帮助我们学习驾驶自动变速箱汽车。
学习电子琴对你以后学习钢琴有帮助。

在语音合成中,开发者经常面临大数据与少标注、大数据与弱计算的矛盾:开发者虽然拥有大量数据,但往往没有标注。
手动数据标注太耗时且无法训练机器。
学习模型;或者,开发者没有海量的数据和计算资源,需要进行模型迁移。
迁移学习可以很好地解决上述矛盾,并具有以下优点:(1)迁移学习需要较少的训练数据,可以更有效地利用现有数据; (2)通过迁移学习的模型泛化能力更好; (3))迁移学习训练过程更加稳定,更容易调试,并且可以增加模型的鲁棒性; (4) 迁移学习可以定制。
总之,迁移学习减少了构建深度学习模型所需的训练数据量、计算能力和工程人才。
正是利用迁移技术,Spichi可以在短时间内将单个说话人的音色快速迁移到四川话、粤语等方言以及英语等外语中。
下一步,Spichi的单人千音功能将逐步覆盖河南话、山东话、东北话等地方方言,并延伸至日语、法语等跨国语言,帮助更多客户打造多语言AI产品。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-06
06-17
06-17
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态