首页 > 科技动态 > 内容

火山语音首位超现实数字员工小灿正式登场

发布于:2024-06-17 编辑:匿名 来源:网络

10月18日,火山语音首位超现实数字员工小灿正式登场。

在最新发布的品牌TVC中,小灿以虚拟产品经理的身份加入了火山之声团队。

刚刚步入职场的小灿就和普通的新人一样。

他还将为能否顺利加入这份工作而挣扎。

入职第一天他也将整装待发,对美好的实习生活充满期待。

TVC中的她阳光可爱,在日常职场中与同事们并没有表现出任何不服气的样子。

她在开会的时候会紧张,她希望自己的成长能够得到大家的认可和重视。

在短短的一分钟短篇故事中,她展示了虚拟数字人丰富的情感世界,直观如眼前。

据了解,小灿由霍山之声与朝夕光年江南团队联合打造,其形象融入了艺术美感。

无论是从数字人的外观和动作,还是到面部微表情、皮肤纹理,甚至头发材质的细节,都具有高度的真实感。

随着小灿的发布,霍山语音团队具备了为3D超写实数字人物制作一整套图像设计、资产制作、高成本影视级CG管道视频内容的能力。

从外部的制作能力到内部的数字人AI驱动来看,火山语音团队都拥有最先进、领先的技术储备,比如AI驱动的口型方向。

火山语音首位超现实数字员工小灿正式登场

该团队采用业界领先的非自回归模型唇形生成网络合成与输入文本或语音完全匹配的唇形,准确率高达 98.55%。

在AI驱动的动作层面,团队基于创新的Motion Blening技术,可以在切换动作时生成过渡帧,让数字人在各种动作切换时不仅能实现毫秒级的切换,还能拥有自然的动作切换效果。

和难以察觉的平滑效果;另外我们还对AI表情与嘴型联合建模、基于语音语义的动作生成,即协同语音技术进行了前瞻性的预研工作,并取得了阶段性成果,这些成果将全部应用于数字真人视频创作、互动和直播等场景。

值得一提的是,此次发布的超写实数字人还拥有“一音频秒级音色再现”技术(零镜头TTS),可以实现真人音色、说话风格、声学环境等的高保真再现。

其他特征。

基于完全自主研发的核心技术架构,关键指标保持行业前列。

此外,节奏模块基于大型自回归GPT模型。

目前训练数据超过20万小时,架构具有高度可扩展性。

未来预计支持超过10000小时的数据训练;模块支持语码转换,即无论提示是中文还是英文,都可以支持直接输出中文、英文及混合内容。

原创音频生成-中文效果生成-英文效果现在霍山语音团队已经建立了包括2D、3D卡通、3D超写实等在内的虚拟数字人产品矩阵,涵盖“广播数字人”和“互动数字人”其中,广播数字人可以通过输入文字或语音生成自然、生动的数字人广播视频。

互动数字人作为广播数字人的升级版,依托霍山语音长期积累的成熟语音交互技术。

它可以“善于听”、“善于说”、“会思考”,可以与用户进行面对面的实时互动。

“交互式数字人集成了全双工语音交互链路,前向兼容语音和文本输入,后向兼容2D和3D数字人表现力。

整体端到端交互时延在ms左右,性能先进。

”团队总结道。

路。

今年6月,火山引擎虚拟人数字平台获得信息通信研究院首批数字人系统基础能力认证。

在“实时高保真孪生数字人关键技术研发及应用示范”项目建设中,霍山语音团队凭借行业领先的AI语音技术和全栈语音产品解决方案能力参与该项目的第三个课题“实时高保真孪生数字人”“人类通用开发平台”正在建设中,正在与江南游戏工作室合作,打造支持定制、适合各类场景的数字人智能“对话”系统。

融合交互理解、智能对话管理、智能驾驶三大模块,满足多种场景需求。

实现多模态交互对话。

霍山语音技术支撑的虚拟数字人始终聚焦于播音、互动、直播三大核心领域。

通过火山引擎,面向金融、汽车、传媒等多个核心行业,提供涵盖“金融客服”、“智能导航”等领域的服务。

、“智能助手”、“虚拟直播”等场景细分解决方案,并可落地于内容制作、视频直播、车载环境等众多场景,为用户带来全新的交互服务和专业的智能体验。

雷锋网(公众号:雷锋网)雷锋网版权文章未经授权禁止转载。

详情请参见转载说明。

火山语音首位超现实数字员工小灿正式登场

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 职业教育品牌“成拉教育”获6600万Pre-A轮融资

    职业教育品牌“成拉教育”获6600万Pre-A轮融资

    中国桃李基金孵化的职业教育品牌“成拉教育”近日完成用友集团、国民教育、晶宇基金Pre-A轮融资,华桃资本为独家融资合作伙伴。 本轮资金将主要投入技术和研发,打造3.0模式的成人在线学习平台。

    06-17

  • 2024年全球半导体营收将增长17%

    2024年全球半导体营收将增长17%

    硅半导体根据Gartner最新预测,2024年全球半导体营收预计将增长16.8%,达到1亿美元。 2020年,市场规模预计将下降10.9%,达到1亿美元。 Gartner 副总裁分析师 Alan Priestley 表示:“现在已经到了年底,对支持图形处理单元 (GPU) 等人工智能 (AI) 工作负载的芯片的强劲需求不

    06-06

  • 亚马逊订购数千套自动驾驶系统以彻底取代卡车司机?

    亚马逊订购数千套自动驾驶系统以彻底取代卡车司机?

    稳定的物流网络是配送能力的保障,亚马逊深知这一点。 据彭博社报道,亚马逊已向 Plus Technology(Plus)订购了一套自动驾驶系统,用于其物流网络,并购买了该公司最多 20% 股份的期权。 这家总部位于加利福尼亚州库比蒂诺的公司成立于 2017 年,是少数几家试图利用无人驾驶

    06-21

  • 继《囧妈》之后,西瓜视频、抖音、今日头条将免费首映电影《大赢家》

    继《囧妈》之后,西瓜视频、抖音、今日头条将免费首映电影《大赢家》

    西瓜视频、抖音、今日头条再次邀请人民全国免费看电影。 据投资界3月20日消息,今日,西瓜视频、抖音、今日头条《大赢家》出品方联合宣布,解压喜剧电影《大赢家》将于3月20日晚8点免费上映。 影片由苗执导,大鹏和柳岩主演。 讲述了一次抢劫演习中发生的幽默故事。 届时,用

    06-18

  • AR-VR光模块供应商“慧牛科技”获数千万A+轮投资

    AR-VR光模块供应商“慧牛科技”获数千万A+轮投资

    投资社区(ID:pedaily)3月30日消息,据36氪消息,AR/VR光模块供应商深圳市慧牛科技有限公司慧牛科技股份有限公司(以下简称“慧牛科技”或“慧牛”)宣布完成数千万元A+轮融资。 本轮投资方包括北京仓林投资和新加坡ZELOS MEGATRENDS Fund。 辉牛科技表示,本轮融资完成后,

    06-18

  • 嘉兴和济药业有限公司完成2.8亿元A轮融资,贝达药业、泰格医药等共同投资

    嘉兴和济药业有限公司完成2.8亿元A轮融资,贝达药业、泰格医药等共同投资

    据投资界10月6日消息,嘉兴和济药业有限公司宣布完成2.8亿元A轮融资,由贝达药业、海正药业、泰格医药、钰盛投资共同投资,并与美国科沃斯药业(纳斯达克股票代码:CRVS)建立战略合作。 和济药业是一家新成立的生物制药公司,其使命是造福中国患者,为治疗癌症、自身免疫性

    06-18

  • “上帝创造的人类都有缺点,更何况是汽车呢!”刚刚315晚会曝光了这些无良商家

    “上帝创造的人类都有缺点,更何况是汽车呢!”刚刚315晚会曝光了这些无良商家

    公关界都在等待这个一年一度的3月15日晚会。 今年开播以来的这档节目,逐渐告别了唤醒国人维权意识、远离陷阱的青春期。 已成为大众消费的风向标。 这不仅是公关人一年中最紧张的时刻,也是对企业应对能力的考验。 一年一度的考试,圈内圈外掀起轩然大波。   有人快乐,有人

    06-18

  • 为欧洲芯片法寻求国际合作,欧盟高官出访日本和韩国

    为欧洲芯片法寻求国际合作,欧盟高官出访日本和韩国

    欧盟委员会主席冯德莱恩9月初表示,欧盟将推出《欧洲芯片法案》,以确保芯片供应安全芯片元器件,将推动芯片生产和研究。 本周,欧盟内部市场专员蒂埃里布雷顿访问了日本和韩国,为拟议法案寻求国际合作。 据《日经亚洲评论》报道,Thierry Breton 在东京会议期间表示,“半导

    06-08

  • 苹果或推出Windows版Safari浏览器,主打隐私保护

    苹果或推出Windows版Safari浏览器,主打隐私保护

    雷锋网12月29日报道称,苹果Safari浏览器预计将有基于Windows平台的版本。 此前,该浏览器仅支持苹果自家的Mac、iPhone和iPad。 设备。 据了解,苹果此前曾推出过基于Windows平台的Safari浏览器,但该项目几年前停止了开发。 现在,一名苹果员工邀请 Chromium 开发者在 Chrom

    06-17

  • 如何打造一款入门级手机? Redmi 8-8A给出了自己的答案

    如何打造一款入门级手机? Redmi 8-8A给出了自己的答案

    语音播放文章内容 Powered by Shensheng Technology 您的浏览器不支持音频元素。 进入2020年,智能手机行业无论是产品形态还是市场结构都进入了稳定发展阶段。 然而,从用户群体的角度来看,该领域仍然存在一些意想不到且容易被忽视的盲点——例如,即使是现在,全球每年仍有

    06-18

  • 生成式人工智能大会在北京热闹非凡!从Sora到具身智能,25位大佬集中传递实用资讯

    生成式人工智能大会在北京热闹非凡!从Sora到具身智能,25位大佬集中传递实用资讯

    今天,在花千树春风吹拂的北京,我们举办了一场盛大而专业的生成式AI迎春晚会。 智东西网4月18日报道,以“重构世界,走向未来”为主题的中国生成人工智能大会今日正式开幕。 今明两天,54位来自产学研投的重量级嘉宾代表将同台探讨生成式AI的未来。 发展现状及未来趋势。 会

    06-17

  • 首次发布 - MarTech SaaS公司“稻米云”获汉能创投数千万元天使轮融资

    首次发布 - MarTech SaaS公司“稻米云”获汉能创投数千万元天使轮融资

    7月7日消息,国内MarTech领域创新SaaS公司“大米营销云”已完成数千万元融资人民币天使轮融资。 ,本轮投资方为汉能创投,云跃资本担任独家投资方。 本次融资将主要用于产品研发、市场营销和团队建设。 大米营销云致力于成为帮助品牌出海的一站式营销SaaS和精准营销服务。 稻

    06-18