首页 > 科技未来 > 内容

让饭迷疯狂的声音克隆技术:DeepSound技术如何用90秒的录音克隆你的声音?

发布于:2024-06-17 编辑:匿名 来源:网络

“通过克隆,可以永远珍藏亲人的声音……这或许就是科技应有的温度。

”在与小米的最新合作中,深声科技为其提供了语音克隆技术,应用于其最新发布的小爱定制语音功能,让米粉们可以合成自己的声音,甚至是父母、孩子、恋人的声音,并且还支持语音分享功能。

例如,明星与粉丝分享自己的声音后,明星和粉丝可以通过他的声音“永远在一起”。

智能语音助手,一个充满想象力的AI应用,正逐渐成为智能终端的基本功能,包括智能手机、智能家居、车辆、陪伴机器人等,其普及度大大提升,语音克隆技术的应用很有可能会加速整个过程。

说起声音克隆技术,并不是深声科技独有,但与竞争对手相比,深声科技CEO周俊明表示:“在声音克隆技术方面,我们在音色还原、发音准确度、音质清晰度等方面都有所提升。

,优势明显,手机语音助手是我们第一个实现场景《语音克隆面临哪些技术挑战?今年1月中旬,申生科技的声音克隆产品正式上线。

在此期间,申生团队在众多竞争对手中成功拿下小米的需求目标。

作为与小米小爱学生的深度合作,深声科技将为语音克隆提供核心技术支持。

让饭迷疯狂的声音克隆技术:DeepSound技术如何用90秒的录音克隆你的声音?

从双方需求匹配、内部评估、交付,历时一个多月。

语音克隆比传统语音合成面临更大的技术挑战。

首先,声音克隆需要C端用户配合录音,所以对录音环境和设备不能有过高的要求。

我们建议用户选择一个尽可能安静的地方,并使用手机来完成录制过程。

其次,考虑到用户体验,需要尽可能缩短录音时长。

这对我们提出了很高的要求。

传统的语音合成需要数十分钟到几个小时的语音数据。

相比之下,声音克隆需要的数据较少,对声学模型的训练要求较高,比如存在发音模糊、发音错误、音素覆盖等一系列问题。

当然,最重要的还是音色还原的问题。

现在,用户只需阅读20句短文本并录制约90秒的语音数据,即可快速克隆自己的声音,并将个人情绪表达、发音特征等信息转移到合成语音中。

甚至连口音都可以很好地克隆。

第三,在实际应用中,我们还必须考虑大量用户发起语音克隆请求的高并发问题。

为了节省成本、提高用户体验,需要解决模型切换、模型并发、合成延迟等一系列挑战。

当大量用户频繁调用声音克隆时,模型之间的切换逻辑就非常重要。

最后,由于收集到的用户数据会上传到服务器进行模型训练,考虑到保护用户隐私和安全,团队提供了私有化部署方案,保证用户数据不泄露。

我们会迎来大规模商业化吗?过去一段时间,百度、科大讯飞、搜狗等公司也推出了语音克隆服务,但似乎并没有赢得用户市场的关注。

深声科技语音克隆技术的推出为何会在用户市场引起如此大的反响?周俊明表示,声音克隆大规模商业化需要几个条件:一是克隆声音音色还原度高,与真人声音无异;第二,用户门槛不能太高,比如录音条件、发音标准等要求不能太高;第三是计算资源的消耗,需要每个人都负担得起;四是创造真正价值、改善人们生活质量的能力。

从这个角度来看,深声科技自与小米合作以来,已经具备了大规模商业化语音克隆技术的能力。

在谈到与普通语音合成的区别时,周俊明表示:普通语音合成解决的是如何很好地传递语音内容并使其更容易被接收的问题。

语音克隆体现了用户的社交属性,让用户可以通过语音为他人服务。

这意味着每个人的声音价值都能得到充分体现,在亲子互动、情感陪伴、泛娱乐等各种场景中具有巨大的应用价值。

安全问题如何解决?智能语音助手引入语音克隆是否会导致更多语音诈骗案件?目前可能存在普遍的担忧:合成技术水平越高,合成语音与人声的差异越小,技术识别就越困难。

对此,周俊明也指出,无需过度担心。

问题在于人耳不够灵敏,无法察觉克隆的声音。

但并没有应用技术手段来区分的压力。

声谱图中克隆的声音与真实的声音明显不同。

克隆声音中的许多特征信息已经丢失。

作为技术服务的出口商,深盛科技也非常关心如何避免该技术被非法应用。

它在推出之前考虑了法律和道德问题,并给出了三??种解决方案:第一,语音克隆能力仅授权给有控制能力的企业客户。

对于C端用户来说,只有选择声音的权限,没有定制克隆声音内容的权限;二是加强内容安全严格审查。

不支持用户克隆随机一段语音,需要用户录制指定的文本,从而降低语音被利用的风险;第三,通过身份认证,结合生物识别等技术,限制语音克隆的使用。

关于深声 深声科技是一家专注于“智能语音”技术研发和业务实施的人工智能公司。

成立于广州天河。

深声科技拥有顶尖的人工智能技术团队,自主研发了语音合成、语音定制、语音克隆等业界领先的语音AI技术。

深声的语音AI技术已落地多个场景,包括语音助手、智能客服、有声阅读、汽车语音、AI教育、动画等。

深声提供的“文字转语音”技术服务支持范围逐步扩大语言从汉语、英语到国内方言和海外语言。

除了不断的技术突破,深声的语音数据生产效率也得到了大幅提升。

例如,交付客户特定的定制声音需要三天时间,支持新语言需要两个月时间。

让声音服务每个人的生活。

申声致力于将语音AI技术融入人们生活的方方面面,以创新科技的力量赋能企业和用户,创造更美好的世界。

对深声科技智能语音技术感兴趣的读者可以前往深声科技官网或微信小程序“深声AI”亲自体验。

让饭迷疯狂的声音克隆技术:DeepSound技术如何用90秒的录音克隆你的声音?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 以色列团队推出世界上最大的实验室培育牛排,由真正的牛细胞 3D 打印而成

    以色列团队推出世界上最大的实验室培育牛排,由真正的牛细胞 3D 打印而成

    12 月 7 日,以色列公司 MeaTech 3D 开发出迄今为止最大的实验室培育牛排,重近一克。 牛排由取自活牛组织样本的真正脂肪和肌肉细胞制成,不使用任何大豆或豌豆蛋白,并经过烹饪以形成令人愉悦的烧烤痕迹。 ▲ 成品。 图片来自:MeaTech 3D生产过程结合了细胞生物学、组织工程

    06-21

  • 连TA都不知道,更何况露营

    连TA都不知道,更何况露营

    露营有多受欢迎?每逢长周末假期,打开朋友圈,总会看到几个朋友,带上折叠椅或餐垫,搭起帐篷或大帐篷,在草坪、沙滩甚至山顶,打造一个城市人的游戏屋。 一座山的。 。 随着生活节奏的加快、远行的不确定性增加,人们“逃离城市”的愿望越来越强烈。 此外,还增加了“月亮椅

    06-21

  • 字节跳动再次布局游戏行业,全资收购深机智能,

    字节跳动再次布局游戏行业,全资收购深机智能,

    据投资界消息,据企查查获悉,字节跳动近期完成了对北京深机智能科技有限公司(以下简称“深机智能”)的全资收购。 公开资料显示,深机智能由前青果智能副总裁郭祥昊于2008年创立,他是北京邮电大学博士自然语言处理(NLP)方向。 他学习了钟义信教授的信息论和神经网络,并

    06-18

  • “家家泉”完成近亿元B轮融资,沣途资本领投

    “家家泉”完成近亿元B轮融资,沣途资本领投

    投资界(ID:pedaily)9月5日消息,水家电品牌“家家泉”(原“熊小夕”)已获完成近亿元人民币B轮融资,本轮融资由沣途资本领投,老股东纪源资本、天图资本跟投,木棉资本独家投资。 这是嘉泉成立两年来完成的第四轮融资。 据悉,本轮募集资金将主要用于嘉泉品牌建设以及新品

    06-17

  • 首次发布 -该核心技术获Pre-A轮融资,蔚来资本、启明创投联合领投

    首次发布 -该核心技术获Pre-A轮融资,蔚来资本、启明创投联合领投

    投资界(ID:pedaily)7月19日消息,通用智能芯片公司该核心技术宣布完成Pre-A轮融资轮融资。 本轮融资由蔚来资本、启明创投联合领投,BAI资本、基石资本、中科之星、嘉实投资、元禾璞华、云九资本跟投。 本轮融资将主要用于扩大研发团队、加快市场布局和生态建设。 据悉,这

    06-17

  • 植物肉品牌“植物教授”获5000万元A轮融资,经纬中国独家投资

    植物肉品牌“植物教授”获5000万元A轮融资,经纬中国独家投资

    投资界(ID:pedaily)8月31日消息,据36氪报道,近日,植物肉品牌“植物教授”完成1万元A轮融资,由经纬中国独家投资,回声资本独家投资。 据悉,本轮融资将用于消费者渗透、产品研发、供应链优化和团队扩张。 此前,年初,植教授获得数千万元天使轮融资,投资方为宝洁校友会

    06-18

  • 中航顾问宁振波:智能制造的基础是数字化,机器换人还只是自动化的老路

    中航顾问宁振波:智能制造的基础是数字化,机器换人还只是自动化的老路

    雷锋网记者:近日,中国信息产业商会主办的第九届航天信息化建设合作峰会召开在北京。 本次峰会以“推动军民深度融合,赋能数字化转型”为主题。 航天科工、航天科技、中国商飞、中航发展等单位信息负责人、行业专家及企业代表参加会议。 会上,中国航空工业信息技术中心顾问

    06-18

  • 全球直播购物平台ShopShops完成1500万美元B轮融资

    全球直播购物平台ShopShops完成1500万美元B轮融资

    投资界(ID:pedaily)6月15日报道,北美精品买手店与设计师品牌集合直购平台SHOPSHOPSWheretoShop完成1万美元B轮融资本轮融资,投资方包括Union Square Ventures、Forerunner Ventures、LightShed Ventures(领投)、Acrew Capital(领投)、Gaingels、Dave Lu、TCG Capital

    06-18

  • 海关总署:前两个月,综合保税区实现进出口总值7649.6亿元,同比增长46.9%

    海关总署:前两个月,综合保税区实现进出口总值7649.6亿元,同比增长46.9%

    据海关总署网站显示,今年前两个月,全国综合保税区发展迅速,实现进出口总值6亿元。 人民币同比增长46.9%,高出进出口总体增速14.7个百分点。 其中,出口1亿元,同比增长71.1%,进口5000万元,同比增长25.1%,成为稳外贸稳外资的重要力量。 听,中小企业反馈平台。 倾听用户

    06-17

  • 广州雷德倍尔完成金阖资本超5000万元B轮战略投资

    广州雷德倍尔完成金阖资本超5000万元B轮战略投资

    据投资界9月7日消息,据Arterial.com报道,广州耀明生物科技(简称雷德倍尔)完成B轮战略投资投资1万多元。 金阖资本(黄金)(领域医疗相关基金)投资。 本次战略融资将推动雷德倍尔两大诊断产品的研发和营销,满足两大疾病领域的临床诊断需求。 同年11月成立,是一家专注于

    06-17

  • 奥普玛生物获近亿元战略投资,华兴医疗产业基金领投

    奥普玛生物获近亿元战略投资,华兴医疗产业基金领投

    据投资界4月18日消息,上海奥普玛生物科技有限公司(以下简称“奥普玛生物”) 》)完成战略投资近亿元。 投资方为华兴医疗产业基金和达辰创投。 值得注意的是,本轮交易是迄今为止中国细胞培养领域最大的单笔融资。   博士。 远普生物创始人、董事长兼总经理肖志华表示,

    06-18

  • 100亿,湖北省设立科技天使基金

    100亿,湖北省设立科技天使基金

    投资界-解码LP消息,4月17日,省科技厅发布《湖北省科创企业全生命周期培育计划(-年)》(以下简称《计划》),瞄准针对科技企业不同生命周期,为科技创新企业提供阶段性培育体系,提供项目、人才、平台、资金等创新支持。 其中,为引导社会资本投资早期、小型、“硬科技”

    06-18