首页 > 科技动态 > 内容

火山语音首位超现实数字员工小灿正式登场

发布于：2024-06-17 编辑：匿名来源：网络

10月18日，火山语音首位超现实数字员工小灿正式登场。

在最新发布的品牌TVC中，小灿以虚拟产品经理的身份加入了火山之声团队。

刚刚步入职场的小灿就和普通的新人一样。

他还将为能否顺利加入这份工作而挣扎。

入职第一天他也将整装待发，对美好的实习生活充满期待。

TVC中的她阳光可爱，在日常职场中与同事们并没有表现出任何不服气的样子。

她在开会的时候会紧张，她希望自己的成长能够得到大家的认可和重视。

在短短的一分钟短篇故事中，她展示了虚拟数字人丰富的情感世界，直观如眼前。

据了解，小灿由霍山之声与朝夕光年江南团队联合打造，其形象融入了艺术美感。

无论是从数字人的外观和动作，还是到面部微表情、皮肤纹理，甚至头发材质的细节，都具有高度的真实感。

随着小灿的发布，霍山语音团队具备了为3D超写实数字人物制作一整套图像设计、资产制作、高成本影视级CG管道视频内容的能力。

从外部的制作能力到内部的数字人AI驱动来看，火山语音团队都拥有最先进、领先的技术储备，比如AI驱动的口型方向。

火山语音首位超现实数字员工小灿正式登场

该团队采用业界领先的非自回归模型唇形生成网络合成与输入文本或语音完全匹配的唇形，准确率高达 98.55%。

在AI驱动的动作层面，团队基于创新的Motion Blening技术，可以在切换动作时生成过渡帧，让数字人在各种动作切换时不仅能实现毫秒级的切换，还能拥有自然的动作切换效果。

和难以察觉的平滑效果；另外我们还对AI表情与嘴型联合建模、基于语音语义的动作生成，即协同语音技术进行了前瞻性的预研工作，并取得了阶段性成果，这些成果将全部应用于数字真人视频创作、互动和直播等场景。

值得一提的是，此次发布的超写实数字人还拥有“一音频秒级音色再现”技术（零镜头TTS），可以实现真人音色、说话风格、声学环境等的高保真再现。

其他特征。

基于完全自主研发的核心技术架构，关键指标保持行业前列。

此外，节奏模块基于大型自回归GPT模型。

目前训练数据超过20万小时，架构具有高度可扩展性。

未来预计支持超过10000小时的数据训练；模块支持语码转换，即无论提示是中文还是英文，都可以支持直接输出中文、英文及混合内容。

原创音频生成-中文效果生成-英文效果现在霍山语音团队已经建立了包括2D、3D卡通、3D超写实等在内的虚拟数字人产品矩阵，涵盖“广播数字人”和“互动数字人”其中，广播数字人可以通过输入文字或语音生成自然、生动的数字人广播视频。

互动数字人作为广播数字人的升级版，依托霍山语音长期积累的成熟语音交互技术。

它可以“善于听”、“善于说”、“会思考”，可以与用户进行面对面的实时互动。

“交互式数字人集成了全双工语音交互链路，前向兼容语音和文本输入，后向兼容2D和3D数字人表现力。

整体端到端交互时延在ms左右，性能先进。

”团队总结道。

路。

今年6月，火山引擎虚拟人数字平台获得信息通信研究院首批数字人系统基础能力认证。

在“实时高保真孪生数字人关键技术研发及应用示范”项目建设中，霍山语音团队凭借行业领先的AI语音技术和全栈语音产品解决方案能力参与该项目的第三个课题“实时高保真孪生数字人”“人类通用开发平台”正在建设中，正在与江南游戏工作室合作，打造支持定制、适合各类场景的数字人智能“对话”系统。

融合交互理解、智能对话管理、智能驾驶三大模块，满足多种场景需求。

实现多模态交互对话。

霍山语音技术支撑的虚拟数字人始终聚焦于播音、互动、直播三大核心领域。

通过火山引擎，面向金融、汽车、传媒等多个核心行业，提供涵盖“金融客服”、“智能导航”等领域的服务。

、“智能助手”、“虚拟直播”等场景细分解决方案，并可落地于内容制作、视频直播、车载环境等众多场景，为用户带来全新的交互服务和专业的智能体验。

雷锋网（公众号：雷锋网）雷锋网版权文章未经授权禁止转载。

详情请参见转载说明。

站长声明

标签：

上一篇：中冶已于本月初向香港联交所申请10月先A后H上市

下一篇：高密度光子集成创新者“启芯光电”获2.4亿元C轮融资

看新项目NO.37｜Induscial Next利用特斯拉成熟的制造技术，推动下一代制造

Industrial Next成立于2007年，全球总部位于苏州园区，团队也位于旧金山，美国。团队于2016年为特斯拉Model 3产能提升和产线升级提供了完整的解决方案，将无人驾驶技术应用于生产制造，降低制造成本和BOM成本，缩短产品生产周期。本期《看见新项目》我们采访了Industrial N

06-18
提高企业服务网点管理效率的关键问题及解决方案

.wp-block-column h3{margin-left:0} 服务网点管理在现代企业运营中发挥着至关重要的作用，特别是对于拥有多个服务网点的企业来说分店或商店。有效的服务网点管理系统可以帮助企业实现服务网络的高效运营和管理。本文将探讨服务网点的管理，并推荐沃峰科技的服务网点管理系

06-18
中国首只核酸药物股Sirnaomics昨天在香港联交所成功上市

Sirnaomics（“Sirnaomics”）是首家临床阶段RNA治疗生物制药公司，在中美两国均具有重要市场地位，核心产品STP的RNAi疗法在肿瘤领域首家取得IIa期临床积极成果。昨日正式在香港联合交易所有限公司（“港交所”）主板上市并开始交易。 Sirnaomics此次全球发售共7,000股，最终

06-18
为什么苹果产品的包装上总是贴有贴纸？

对于传统产品，顾客如何打开盒子通常是设计师最后考虑的事情。但对苹果来说，低成本的盒子和里面的高利润电子产品一样值得关注。 ——Adam Lashinsky的书《苹果》（Inside Apple）无论是广为流传的乔布斯创业故事，还是苹果公司近年来发布的新品，都展现了该公司对产品包装近

06-21
Groupon IPO承销商增至14家花旗巴克莱选定

北京时间7月15日消息，据路透社报道，团购网站Groupon周四晚间提交的申请文件显示，该公司IPO（首次公开募股）承销商数量已增加到 14 个，而之前为 3 个。　　Groupon此次新增的11家承销商包括JP摩根银行、投行Allen & Co、美银美林、巴克莱资本、花旗集团、德意志银行证券（

06-17
中国宝武发起设立碳中和主题基金，总规模500亿

据投资界（ID：pedaily）7月16日消息，中国宝武钢铁集团有限公司携手碳中和主题基金保险（集团）股份有限公司与建信金融资产投资有限公司共同发起设立的国家绿色发展基金有限公司、太平洋宝武碳中和股权投资基金于2017年在上海签约成立。 15日。该基金是目前国内市场最大的

06-18
生物基材料公司中科国盛获Consumer+轮数千万元融资，由君盛投资领投

据投资界（ID：pedaily）2月28日消息，日前，中科国盛正式宣布完成数千万元元天使+轮融资，由君盛投资领投，君联资本、碧桂园创投跟投，发现资本跟投。中科国盛成立于2001年，致力于用生物质改变生活。核心科研人员均毕业于中科院各研究所。他们在生物质催化转化和呋喃材

06-18
动漫IP公司分子互动完成1亿元B轮融资，腾讯领投，哔哩哔哩跟投，

投资圈（ID：pedaily）1月20日消息，动漫IP开发公司分子互动近日完成1亿元B轮融资。本轮融资，腾讯领投，哔哩哔哩跟投。 Molecular Interactive于今年10月成立。最初专注于社交媒体营销，与数十家知名品牌达成合作。目前，分子互动已发展成为一家以动漫IP孵化与开发为核心

06-18
昆明高新区举办上市公司及优质企业投融资路演专场活动

5月10日，由昆明高新区金融分局、昆明高新区联合主办云南省科技创新基金联合体股权投资有限公司基金之家、云南省对外科技合作协会、昆明市知识产权服务业联合举办的“争向新”投融资路演系列活动集聚区——高新区上市公司和优质企业专场活动在昆明高新区火炬大厦举行。参加活

06-18
B站成立13周年之际，陈睿发表演讲：B站可能消失，但好内容永存

6月26日，哔哩哔哩（以下简称“B站”）庆祝成立13周年。董事长与哔哩哔哩CEO陈睿围绕《宝藏UP主》进行了主题演讲，分享了哔哩哔哩过去一年的发展历程。他在致辞中表示：“能够持续产生宝UP主，不仅是B站的生命力，也是B站的价值。 ”同时，陈睿还为B站社区产品提出最有效建

06-18
【BAT离职员工向百度求助】风投圈人脉广泛的弗拉基米尔·王吴世春、科技大师王梦秋、“七剑客”之一的王啸……

编者按：在当前的风险投资界，BAT已经成为人才输出大国。腾讯的南极圈、百度的百老汇、阿里巴巴的前橙社，都是由退休的BAT员工组成的老同事圈子。看看那些离开BAT的人，有的退隐世间，不顾世事的纷扰，追求和平与安宁；有些人雄心勃勃，创办了自己的企业，试图成就伟大的事

06-18
俄罗斯最大芯片代工厂米克朗力争3年内实现月产6000片的90纳米产能

IT之家IT之家5月2日报道称，由于代工业务禁令，俄罗斯此前曾试图实现这一目标3.19万亿卢布。电子工业的快速发展将实现90纳米、28纳米工艺芯片的自主生产。俄罗斯最大的半导体制造商米克朗表示，其米克朗工厂已投入使用90纳米技术生产线。《生意人报》援引消息人士的话称，

06-06