首页 > 科技未来 > 内容

让饭迷疯狂的声音克隆技术:DeepSound技术如何用90秒的录音克隆你的声音?

发布于:2024-06-17 编辑:匿名 来源:网络

“通过克隆,可以永远珍藏亲人的声音……这或许就是科技应有的温度。

”在与小米的最新合作中,深声科技为其提供了语音克隆技术,应用于其最新发布的小爱定制语音功能,让米粉们可以合成自己的声音,甚至是父母、孩子、恋人的声音,并且还支持语音分享功能。

例如,明星与粉丝分享自己的声音后,明星和粉丝可以通过他的声音“永远在一起”。

智能语音助手,一个充满想象力的AI应用,正逐渐成为智能终端的基本功能,包括智能手机、智能家居、车辆、陪伴机器人等,其普及度大大提升,语音克隆技术的应用很有可能会加速整个过程。

说起声音克隆技术,并不是深声科技独有,但与竞争对手相比,深声科技CEO周俊明表示:“在声音克隆技术方面,我们在音色还原、发音准确度、音质清晰度等方面都有所提升。

,优势明显,手机语音助手是我们第一个实现场景《语音克隆面临哪些技术挑战?今年1月中旬,申生科技的声音克隆产品正式上线。

在此期间,申生团队在众多竞争对手中成功拿下小米的需求目标。

作为与小米小爱学生的深度合作,深声科技将为语音克隆提供核心技术支持。

让饭迷疯狂的声音克隆技术:DeepSound技术如何用90秒的录音克隆你的声音?

从双方需求匹配、内部评估、交付,历时一个多月。

语音克隆比传统语音合成面临更大的技术挑战。

首先,声音克隆需要C端用户配合录音,所以对录音环境和设备不能有过高的要求。

我们建议用户选择一个尽可能安静的地方,并使用手机来完成录制过程。

其次,考虑到用户体验,需要尽可能缩短录音时长。

这对我们提出了很高的要求。

传统的语音合成需要数十分钟到几个小时的语音数据。

相比之下,声音克隆需要的数据较少,对声学模型的训练要求较高,比如存在发音模糊、发音错误、音素覆盖等一系列问题。

当然,最重要的还是音色还原的问题。

现在,用户只需阅读20句短文本并录制约90秒的语音数据,即可快速克隆自己的声音,并将个人情绪表达、发音特征等信息转移到合成语音中。

甚至连口音都可以很好地克隆。

第三,在实际应用中,我们还必须考虑大量用户发起语音克隆请求的高并发问题。

为了节省成本、提高用户体验,需要解决模型切换、模型并发、合成延迟等一系列挑战。

当大量用户频繁调用声音克隆时,模型之间的切换逻辑就非常重要。

最后,由于收集到的用户数据会上传到服务器进行模型训练,考虑到保护用户隐私和安全,团队提供了私有化部署方案,保证用户数据不泄露。

我们会迎来大规模商业化吗?过去一段时间,百度、科大讯飞、搜狗等公司也推出了语音克隆服务,但似乎并没有赢得用户市场的关注。

深声科技语音克隆技术的推出为何会在用户市场引起如此大的反响?周俊明表示,声音克隆大规模商业化需要几个条件:一是克隆声音音色还原度高,与真人声音无异;第二,用户门槛不能太高,比如录音条件、发音标准等要求不能太高;第三是计算资源的消耗,需要每个人都负担得起;四是创造真正价值、改善人们生活质量的能力。

从这个角度来看,深声科技自与小米合作以来,已经具备了大规模商业化语音克隆技术的能力。

在谈到与普通语音合成的区别时,周俊明表示:普通语音合成解决的是如何很好地传递语音内容并使其更容易被接收的问题。

语音克隆体现了用户的社交属性,让用户可以通过语音为他人服务。

这意味着每个人的声音价值都能得到充分体现,在亲子互动、情感陪伴、泛娱乐等各种场景中具有巨大的应用价值。

安全问题如何解决?智能语音助手引入语音克隆是否会导致更多语音诈骗案件?目前可能存在普遍的担忧:合成技术水平越高,合成语音与人声的差异越小,技术识别就越困难。

对此,周俊明也指出,无需过度担心。

问题在于人耳不够灵敏,无法察觉克隆的声音。

但并没有应用技术手段来区分的压力。

声谱图中克隆的声音与真实的声音明显不同。

克隆声音中的许多特征信息已经丢失。

作为技术服务的出口商,深盛科技也非常关心如何避免该技术被非法应用。

它在推出之前考虑了法律和道德问题,并给出了三??种解决方案:第一,语音克隆能力仅授权给有控制能力的企业客户。

对于C端用户来说,只有选择声音的权限,没有定制克隆声音内容的权限;二是加强内容安全严格审查。

不支持用户克隆随机一段语音,需要用户录制指定的文本,从而降低语音被利用的风险;第三,通过身份认证,结合生物识别等技术,限制语音克隆的使用。

关于深声 深声科技是一家专注于“智能语音”技术研发和业务实施的人工智能公司。

成立于广州天河。

深声科技拥有顶尖的人工智能技术团队,自主研发了语音合成、语音定制、语音克隆等业界领先的语音AI技术。

深声的语音AI技术已落地多个场景,包括语音助手、智能客服、有声阅读、汽车语音、AI教育、动画等。

深声提供的“文字转语音”技术服务支持范围逐步扩大语言从汉语、英语到国内方言和海外语言。

除了不断的技术突破,深声的语音数据生产效率也得到了大幅提升。

例如,交付客户特定的定制声音需要三天时间,支持新语言需要两个月时间。

让声音服务每个人的生活。

申声致力于将语音AI技术融入人们生活的方方面面,以创新科技的力量赋能企业和用户,创造更美好的世界。

对深声科技智能语音技术感兴趣的读者可以前往深声科技官网或微信小程序“深声AI”亲自体验。

让饭迷疯狂的声音克隆技术:DeepSound技术如何用90秒的录音克隆你的声音?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 安徽苏州10亿规模引导基金GP

    安徽苏州10亿规模引导基金GP

    苏州信息产业投资引导基金关于公开遴选子基金管理机构(第一批)的公告,是为了充分发挥苏州市的产业引导和政策扶持作用政府资金,带动更多社会资本投入苏州信息基础设施建设,加快苏州信息产业发展进程,促进高端产业要素集聚,培育数据服务企业集群,持续引领高端产业发展。

    06-18

  • MarTech服务商火眼云获5000万元A轮融资

    MarTech服务商火眼云获5000万元A轮融资

    据投资界8月18日消息,据36氪报道,针对To B企业获客的MarTech服务商“火眼云”获得A轮融资1万元A轮融资。 本轮融资由高杰资本领投,金沙江联合资本、阿米巴资本跟投。 老股东阿米巴资本再次增持。 火眼云此前已获得天天投资、西山天使会天使轮投资、阿米巴资本Pre-A轮融资。

    06-18

  • 启明创投:一位VC探索中国乡村振兴之路

    启明创投:一位VC探索中国乡村振兴之路

    这是创投圈罕见的一幕——周六(1月20日)晚7点,启明创投创始管理合伙人邝子平,出现了。 土家品直播间与中国农村发展基金会常务副理事长、高土集团创始人、董事长兼CEO刘文奎,高土家品CEO陈向东一起完成了自己的第一次直播带货。 此次,他们向观众和消费者介绍和展示了许多

    06-17

  • 易会满:严惩不守法、违反市场规则的机构

    易会满:严惩不守法、违反市场规则的机构

    证监会主席易会满表示,监管部门的放开需要建立在行业自身管控的基础上。 行业机构要坚守底线,诚信经营,提高自律能力,做负责任、有结构、受人尊敬的企业,切实塑造良好形象,拓展行业创新发展空间。 对于那些不守法、违反市场规则的机构,证监会也将坚持零容忍态度,严惩无

    06-18

  • 耀明集团加快并购步伐,将广西幸福保险纳入旗下

    耀明集团加快并购步伐,将广西幸福保险纳入旗下

    耀明保险服务集团(纳斯达克股票代码:CISG)正在加快旗下保险中介行业的并购步伐。 ?继顺利完成后4月中旬最大的公调理赔收购案中,泛华集团旗下保险中介机构数量增至36家,其中保险代理机构28家,保险经纪公司5家,保险理算公司3家。 日前,耀明保险服务集团宣布,已签署收购

    06-17

  • “北大吃肉佬”卖苹果醋,即将IPO

    “北大吃肉佬”卖苹果醋,即将IPO

    在中国任何一个“喝”生意都是极其巨大的。 作者我戴昌洲杨文静报道我投资PEdaily 继东鹏特饮之后,又一饮料IPO即将到来。 投资界——天天IPO获悉,广东证监局天地一号下发了受理工作完成函。 广东证监局完成中信证券首次公开发行股票并在深圳证券交易所主板上市申请的受理。

    06-18

  • 市值一夜消失27亿!李斌:蔚来不排除在中国IPO

    市值一夜消失27亿!李斌:蔚来不排除在中国IPO

    财报一出,蔚来股价一夜暴跌逾8点。 据投资界消息,蔚来昨晚公布一季度财报。 财报显示,蔚来一季度仅交付3辆汽车,汽车销售收入12.56亿元,环比下降53.2%。 值得一提的是,蔚来一季度整车销售利润率为-7.4%。 以蔚来最便宜的入门级车型ES6计算,蔚来每售出一辆车将损失2.6万

    06-18

  • 1200万英镑!英国桑坦德银行向Anesco提供开发可再生能源项目的贷款

    1200万英镑!英国桑坦德银行向Anesco提供开发可再生能源项目的贷款

    英国桑坦德银行向Anesco提供了10,000英镑的循环贷款,以支持其在英国和欧洲的可再生能源开发项目,包括五个电池存储项目和三个太阳能发电场,为Anesco做准备建造。 邓迪、梅尔克舍姆、诺丁汉、伊普斯威奇和埃塞克斯的电池存储项目将于春季投入运营。 英格兰和南威尔士的三个太

    06-08

  • 内容创作运营平台“考拉看看”获数百万天使轮融资

    内容创作运营平台“考拉看看”获数百万天使轮融资

    据投资界8月3日消息,近日内容创作运营平台考拉看看获得宣布数百万天使轮融资< titlesplit >投资者尚未披露融资情况。   Kaolakankankan 成立于 4 年前。 据了解,考拉坎坎坎从服务B端和G端(政府)入手,从商业写作出发,为名人、企业和政府提供出版物写作和写作。 出版、

    06-18

  • 紫光展锐全面完成5G SA-NSA室内测试

    紫光展锐全面完成5G SA-NSA室内测试

    紫光展锐近日宣布,在IMT-(5G)推进组组织的中国5G增强技术研发测试中,已全面完成基于5G SA/NSA的5G SA和NSA室内测试。 3GPP R15 标准。 两种 NSA 模式下的室内测试。 此次测试使用基于紫光展锐5G多模芯片Ivy的测试终端,与华为、中兴通讯合作,围绕2.6G/3.5G频段、NSA、SA模

    06-06

  • 恒迈微获数千万元Pre-A轮融资,集白资本领投

    恒迈微获数千万元Pre-A轮融资,集白资本领投

    投资界(ID:pedaily)据12月6日消息,集成MEMS微泵器件研发公司“恒脉微”近日完成数千万元天使轮融资,由集百资本领投,南京创新投资集团、南京麒麟创投跟投。 本轮融资将用于第六代MEMS压力测量血压检测手表的实验线建设、团队扩充以及量产。 恒迈微成立于2007年,是MEMS微

    06-17

  • 工信部:1-3月锂离子电池产量同比增长83.4%

    工信部:1-3月锂离子电池产量同比增长83.4%

    工信部数据显示,3月份,全国锂离子电池产量电池产量19.3亿只,同比增长52.8%; 1-3月,锂离子电池产量47.9亿只,同比增长83.4%。 1-3月,全国规模以上电池生产企业营业收入1亿元,同比增长73.3%;利润总额2亿元,同比增长0.2 %。

    06-17