以色列团队推出世界上最大的实验室培育牛排,由真正的牛细胞 3D 打印而成
06-21
“通过克隆,可以永远珍藏亲人的声音……这或许就是科技应有的温度。
”在与小米的最新合作中,深声科技为其提供了语音克隆技术,应用于其最新发布的小爱定制语音功能,让米粉们可以合成自己的声音,甚至是父母、孩子、恋人的声音,并且还支持语音分享功能。
例如,明星与粉丝分享自己的声音后,明星和粉丝可以通过他的声音“永远在一起”。
智能语音助手,一个充满想象力的AI应用,正逐渐成为智能终端的基本功能,包括智能手机、智能家居、车辆、陪伴机器人等,其普及度大大提升,语音克隆技术的应用很有可能会加速整个过程。
说起声音克隆技术,并不是深声科技独有,但与竞争对手相比,深声科技CEO周俊明表示:“在声音克隆技术方面,我们在音色还原、发音准确度、音质清晰度等方面都有所提升。
,优势明显,手机语音助手是我们第一个实现场景《语音克隆面临哪些技术挑战?今年1月中旬,申生科技的声音克隆产品正式上线。
在此期间,申生团队在众多竞争对手中成功拿下小米的需求目标。
作为与小米小爱学生的深度合作,深声科技将为语音克隆提供核心技术支持。

从双方需求匹配、内部评估、交付,历时一个多月。
语音克隆比传统语音合成面临更大的技术挑战。
首先,声音克隆需要C端用户配合录音,所以对录音环境和设备不能有过高的要求。
我们建议用户选择一个尽可能安静的地方,并使用手机来完成录制过程。
其次,考虑到用户体验,需要尽可能缩短录音时长。
这对我们提出了很高的要求。
传统的语音合成需要数十分钟到几个小时的语音数据。
相比之下,声音克隆需要的数据较少,对声学模型的训练要求较高,比如存在发音模糊、发音错误、音素覆盖等一系列问题。
当然,最重要的还是音色还原的问题。
现在,用户只需阅读20句短文本并录制约90秒的语音数据,即可快速克隆自己的声音,并将个人情绪表达、发音特征等信息转移到合成语音中。
甚至连口音都可以很好地克隆。
第三,在实际应用中,我们还必须考虑大量用户发起语音克隆请求的高并发问题。
为了节省成本、提高用户体验,需要解决模型切换、模型并发、合成延迟等一系列挑战。
当大量用户频繁调用声音克隆时,模型之间的切换逻辑就非常重要。
最后,由于收集到的用户数据会上传到服务器进行模型训练,考虑到保护用户隐私和安全,团队提供了私有化部署方案,保证用户数据不泄露。
我们会迎来大规模商业化吗?过去一段时间,百度、科大讯飞、搜狗等公司也推出了语音克隆服务,但似乎并没有赢得用户市场的关注。
深声科技语音克隆技术的推出为何会在用户市场引起如此大的反响?周俊明表示,声音克隆大规模商业化需要几个条件:一是克隆声音音色还原度高,与真人声音无异;第二,用户门槛不能太高,比如录音条件、发音标准等要求不能太高;第三是计算资源的消耗,需要每个人都负担得起;四是创造真正价值、改善人们生活质量的能力。
从这个角度来看,深声科技自与小米合作以来,已经具备了大规模商业化语音克隆技术的能力。
在谈到与普通语音合成的区别时,周俊明表示:普通语音合成解决的是如何很好地传递语音内容并使其更容易被接收的问题。
语音克隆体现了用户的社交属性,让用户可以通过语音为他人服务。
这意味着每个人的声音价值都能得到充分体现,在亲子互动、情感陪伴、泛娱乐等各种场景中具有巨大的应用价值。
安全问题如何解决?智能语音助手引入语音克隆是否会导致更多语音诈骗案件?目前可能存在普遍的担忧:合成技术水平越高,合成语音与人声的差异越小,技术识别就越困难。
对此,周俊明也指出,无需过度担心。
问题在于人耳不够灵敏,无法察觉克隆的声音。
但并没有应用技术手段来区分的压力。
声谱图中克隆的声音与真实的声音明显不同。
克隆声音中的许多特征信息已经丢失。
作为技术服务的出口商,深盛科技也非常关心如何避免该技术被非法应用。
它在推出之前考虑了法律和道德问题,并给出了三??种解决方案:第一,语音克隆能力仅授权给有控制能力的企业客户。
对于C端用户来说,只有选择声音的权限,没有定制克隆声音内容的权限;二是加强内容安全严格审查。
不支持用户克隆随机一段语音,需要用户录制指定的文本,从而降低语音被利用的风险;第三,通过身份认证,结合生物识别等技术,限制语音克隆的使用。
关于深声 深声科技是一家专注于“智能语音”技术研发和业务实施的人工智能公司。
成立于广州天河。
深声科技拥有顶尖的人工智能技术团队,自主研发了语音合成、语音定制、语音克隆等业界领先的语音AI技术。
深声的语音AI技术已落地多个场景,包括语音助手、智能客服、有声阅读、汽车语音、AI教育、动画等。
深声提供的“文字转语音”技术服务支持范围逐步扩大语言从汉语、英语到国内方言和海外语言。
除了不断的技术突破,深声的语音数据生产效率也得到了大幅提升。
例如,交付客户特定的定制声音需要三天时间,支持新语言需要两个月时间。
让声音服务每个人的生活。
申声致力于将语音AI技术融入人们生活的方方面面,以创新科技的力量赋能企业和用户,创造更美好的世界。
对深声科技智能语音技术感兴趣的读者可以前往深声科技官网或微信小程序“深声AI”亲自体验。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-21
06-18
06-17
06-18
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态