快手与上海达成战略合作
06-18
虚拟人那年,大模型“复兴”了很多行业,其中最具革命性的就是从活死人坟墓里拉出虚拟数字人(以下简称虚拟人)。
还没过年,过年期间很受欢迎的元宇宙就已经失宠了。
虚拟人作为元宇宙的遗孀,也难逃霜冻的命运。
许多虚拟人初创企业已经开始进入融资困难、产品无法推出的困难阶段;就连百度、腾讯等大厂也开始淘汰曾重金打造的希壤、智影等专为虚拟人打造的平台。
正当大家以为虚拟人要经历一个漫长寒冷的冬天时,大模特来了。
大模式的到来首先意味着除了元宇宙之外还有新的观念、新的故事;但更重要的是,大模型的能力确实对虚拟人的技术产生了深远的影响,元宇宙时代无法解决的成本高、生产周期慢、门槛高等问题也开始被克服一一按大模型;同时,大车型让虚拟人真正开始大规模落地并融入行业,这是产业链成熟的关键一步。
但这一年仍然很混乱。
年初,死而复生的虚拟人开始疯狂寻找登陆方案;年中,嗅到商机的代理商带着上千名虚拟人冲进直播间,开始打着科技的幌子疯狂割韭菜,这也导致企业客户在虚拟人身上的时间不多了。
到了年底,当泡沫逐渐消失、技术逐渐成熟时,整个市场开始回归平静,产业链开始分化,上中下游分工逐渐清晰,各界不再追求形式,开始真正思考虚拟人能带来什么。
什么? 毫无疑问,对于虚拟人来说最重要的场景并不是他现在所经历的。
它是现实世界和虚拟世界的超级入口,是人生游戏中的真实NPC。
但想要实现这个目标,无论是技术还是生态,都还处于早期阶段。
年底,我们将从技术、产品、商业化三个层面与众多厂商一起回顾虚拟人的一年。
1、大模型让虚拟人“活了” 在大模型到来之前,虚拟人一直无法回避成本过高的问题。
当年,虚拟人通常都会进行一对一的定制,价格从几万到几十万不等,但即便如此,虚拟人的成绩也并不理想。
某知名酒类企业品牌经理告诉《自我象限》,该公司曾尝试在机场大屏幕上用虚拟人做广告,但即使找到国内知名生产商,花费近60万元,效果仍然是“乍一看是False”。
成本高、实施效果差的直接原因自然是技术不成熟。
在大型模型出现之前,虚拟人的大部分作品都是由真人驾驶,需要专门的演员穿上设备,通过动作捕捉技术进行长期的数据采集,完成3D建模。
这种形式人工成本高,生产周期长。
一位虚拟人实践者告诉《自我象限》,一份虚拟人资料的收集需要专门的制作团队长达数月的时间。
之后需要专业技术人员进行专门的调校。
这自然直接增加了虚拟人的生产成本。
某虚拟人厂家告诉我们:“如果找到演员来拍摄,我们几乎要亏本卖掉一个。
”除了真人司机,还有靠算法驱动的虚拟人。
但这类虚拟人前期需要大量数据来训练各种驾驶员模型,最终效果还受到语音合成、NLP技术、语音识别、CG渲染等技术的影响。
虽然这类虚拟人在大型号之前就已经在某些特定方向上拥有了相对稳定的技术,但仍然缺乏一个强大的“大脑”来统一各个模块,让虚拟人达到预期的效果。
此外,在大模型出现之前,受传统算法驱动的虚拟人通常依靠预设参数和有限的模型进行训练。
然而大模型之后,大模型的生成能力给了虚拟人几乎无限的训练参数。
。
▲图片来源:中航证券研究所 如今,大型车型作为产能已经渗透到整个虚拟人生产产业链,这直接推动了虚拟人生产成本的大幅下降,从之前的十万左右下降到千元左右。
。
生产周期也从几个月缩短到几个小时。
国内最早布局AI数字人的企业之一“硅智”告诉《自我象限》:“硅基数字人图像克隆产品自推出以来,统一定价为千元,并扩大了市场份额通过标准化的价格和服务,目前市场上的售价从几百到几千不等,新的一年我们正在考虑降低门槛,进一步降低成本,采取新的商业模式。
”降低成本和提高效率是关键因素。
第一层变化是大模型带来的。
大模型技术不仅直接降低了虚拟人的制作难度,还让虚拟人看起来更加人性化。
例如,大模型改变了虚拟人过去依靠CG技术进行3D建模的传统方法。
而是使用视频大模型制作工具,通过算法高效生成3D模型。
这使得虚拟人的面部细节更加真实,他的面部表情和唇形也更加真实。
同步性也得到了改进,让虚拟人说话时看起来更加自然。

此外,大模型还提高了虚拟人的互动能力,让虚拟人从单项输出转向与人的事实互动。
据IDC咨询,根据虚拟人的自动化水平,可分为L1-L5阶段。
如下图所示,我们目前处于L3-L4的中期阶段。
在直播间或者虚拟人的互动设备中,用户可以通过文字与虚拟人进行实时交流对话,介绍产品、为用户解决问题等。
▲图片来源:IDC报告截图。
某2D虚拟人厂商向《自我象限》提及:“目前比较智能的虚拟人可以实现直播互动,其背后的技术原理在于企业提前建立的模板库或知识库,一旦触发对应的关键词在直播中,虚拟人可以实时检索内容进行解答。
”但从效果来看,这项技术还不够成熟。
有用户反映:“在直播间提出问题,虚拟人需要十分钟才能回复,他没有耐心在直播间等待。
”最后,AIGC的生产能力也赋予了虚拟人“灵魂”,商汤智能研究院梳理了AI数字智能的三大特征,包括多模态交互、深度学习能力和AIGC生产力,相比早期的虚拟人生产。
AIGC以人工为主,大大提高了AI虚拟人的制作效率,降低了制作门槛;大模型让虚拟人能够深度学习更多的知识和技能,识别图像、视频、音频等多模态内容。
为虚拟人与真人自然交互的实现提供了基础 ▲图片来自Quadrant,转载时请注明出处,很大程度上解决了虚拟人在自然语言理解和内容输出方面的能力。
在直播场景中,虚拟人能够凭借大模生成的能力,很好地完成口播内容、剧本甚至剧本的剧本写作工作,大大降低了产业链的门槛,让虚拟人不仅是一个形象,也是一种生产工具。
目前,部分虚拟人厂商已开始向全代链延伸,如“一键生成视频文案”、“一键生成讲解视频素材”、“多语言快速翻译”等,从虚拟人的技术提供商转变为更全面的解决方案提供商。
微软小冰CEO李迪甚至提出,虚拟人的未来将是混合模式。
《自我象限》认为,下一阶段,虚拟人将进入“虚拟人+”阶段。
虚拟人+RPA在公司内部打造数字化员工;虚拟人+AI Agent打造C端陪伴机器人;虚拟人+AR/VR在3D空间中创造可见的人。
游戏NPC;虚拟人+具身智能赋予人形机器人灵魂。
如果多种技术充分融合,虚拟人就可以真正成为“入门级应用”。
届时,竞争的重点将是虚拟人的开放性、生态建设、场景拓展等综合能力。
2. 虚拟人,选择 2D 还是 3D? 随着大车型带动虚拟人的爆发,市场上虚拟人的种类也逐渐丰富起来。
从2D到3D,从真人到算法,变得越来越令人着迷。
这背后的本质其实是市场对虚拟人的分类标准不同。
不过,《自我象限》在梳理了一些常用的标准和分类后发现,在产品实现上,虚拟人其实更多的是依靠视觉差异来进行分类,即2D摄像头和3D摄像头。
从技术、产业链和应用场景来看,2D技术和3D技术走上了两条截然不同的道路。
▲图片来自Quadrant原创,转载请注明出处。
本质上,虚拟人的最终目标是无限接近真人的形象,因为只有这样,虚拟人才能给用户带来与人类一样的感受和互动体验。
从这个标准来看,3D 虚拟人更符合这个目标,也是未来的应用方向。
但相比之下,2D 虚拟人的制作成本更低,应用更简单,可以在短时间内带来大规模商用。
从技术角度来看,两位虚拟人背后构建的技术架构也完全不同。
2D虚拟人更注重面部表情、嘴部动作和说话的语气; 3D虚拟人更注重整体协调、说话时的肢体动作以及虚拟人与空间的几何关系等。
具体来说,2D图像可以使用图片处理器快速生成,而3D图像则需要建模、动画、渲染等环节; 2D图像需要的数据量较小,不需要很高的计算能力,而3D图像则恰恰相反; 2D图像需要的数据较少,并且不需要很高的计算能力。
虚拟人对精度要求不高,但3D虚拟人却要达到高仿真的拟人效果。
技术差异导致3D虚拟人的制作成本远高于2D虚拟人。
当时制作当时非常受欢迎的3D虚拟人和刘夜兮的投资高达百万元。
因此,在最后一波元宇宙浪潮中,3D虚拟人作为主角走红,但距离能够飞入寻常百姓家还有很长的路要走。
因此,2D虚拟人抓住了机会,填补了这一需求缺口。
据市场调研,目前,百度、商汤科技、魔发科技等公司涉足3D打印领域;腾讯、京东、快手、极狗科技、万兴科技、宜蓝科技正在向2D打印方向更新产品和服务,其中有以方糖星球、真时通、易观国际、天极科技为代表的公司在使用以虚拟空间为切入点,完善虚拟人的配套设施。
深耕3D打印的厂商魔发科技告诉《自我象限》,魔发科技的全栈技术主要包括四大维度,分别是AIGC 3D逼真图像、AIGC 3D动画、AIGC声音和AIGC文字。
幽研产品中,还涉及AIGC 3D镜面机芯、AIGC灯光等技术,是一个极其复杂的综合考虑。
对于3D打印的困难,Mofa坦言,目前的生成技术正在逐渐被攻克,但高质量的3D数据是行业内非常稀缺的资源,这也是3D打印的障碍之一。
AIGC Vincent Video需要依靠高质量的3D训练数据来生成具有稳定几何和空间关系的视频。
2D视频厂商想要从0到1构建3D数据几乎是不可能的。
魔发科技认为:“3D机器人是一种角色形态载体,如果能用,就需要以产品的形式实现来解决企业的实际问题。
”这意味着机器人制造商不仅需要提供3D机器人产品,还需要与公司的业务场景相结合,赋予公司一定的自由度来创建3D虚拟人生产平台。
目前魔发科技打造了端到端的超写实3D虚拟人工业生产线和“3D虚拟人AIGC平台-星云平台”,为企业提供一系列生成工具。
企业可以根据自身需求更加灵活地调整虚拟人的细节和结构。
以及适应的使用场景。
商汤科技还基于日日新大模型打造了如英虚拟人生产平台。
基于在视觉和语音领域积累的3万个算法模型,虚拟人可以快速识别和响应,并与用户建立对话关系。
而且,虚拟人事后也不会“失忆”,继续学习迭代。
相比之下,2D虚拟人的制作过程要简单得多。
一位2D虚拟人厂家向我们介绍:“目前2D虚拟人的制作方法有两种,一种是让真人录制,然后帮他们定制图像。
另一种是从用户提供的视频中提取图像并进行制作。
”然后在各种场景下使用,市面上的2D虚拟人定制工具的逻辑基本相同:输入文案素材,生成简单的虚拟人形象。
传统视频制作过程中的手动处理时间。
90%,模型训练时间减少60%,各类定制数字人训练可在48小时内完成。
目前文胜AI数字人视频时长约为几分钟。
随着技术的进步,未来Vincent Video的效率将会不断提高。
大型号降低了虚拟人的生产成本,也降低了虚拟人的售价。
因为便宜,2D虚拟人开始铺天盖地的进入直播间。
短视频很多大V开始拥有数字化身。
刘润、周鸿祎先后亮相自己的虚拟人头像。
他们7×7、全年无休,24小时待在直播间。
层出不穷的推出产品,无论是大公司还是中小企业,对虚拟人的热情都极高,而这也吸引了一大批没有真正技术,只是打着技术幌子炫耀的代理商和壳厂商。
。
今年7月至8月,小红书、闲鱼、淘宝、抖音等平台开始出现“99元”、“元”、“元”虚拟人。
据“自我象限”调查显示,这些卖家往往通过各种成功案例吸引用户下单,但下单后,无论使用还是售后,都存在着一个个“陷阱”,只为“卖”,不是为了“用”,虚拟人的受欢迎程度被夸大了。
高的。
想要省事的买家以为自己赶上了潮流,结果却损失惨重;想赚快钱的卖家趁机,成功收获了第一批韭菜。
一位品牌商家告诉《自我象限》:“虚拟人最红的时候,我就买了虚拟人的主播,最初的几次直播都非常好,前三个月几乎无法盈利或亏损。
7、8月的时候,我就买了一些直播。
”今年,光伏账单超过1万元,加上虚拟人主播的损失约10万元,“行业鱼龙混杂”,让很多原本想尝试的企业望而却步。
但到了年底,通过密集出台监管政策以及平台收紧虚拟人直播条件,混乱现象暂时得到控制。
业界回到冷静期,开始真正思考虚拟人能做什么。
? 3、虚拟人走红,花式商业化 事实上,直到今年,数字人才才真正步入商业化的正轨。
硅智创始人兼CEO司马华鹏曾在接受采访时提到,“数字人每年都在提升,但没有人免费使用”。
今年,我们也经历了一些新的变化,“去年我们克隆了几十万数字人,一些客户不愿意公开说他们正在使用AI来辅助他们的工作,但今年每个人都愿意这么说。
“ChatGPT出现后,整个行业的心态发生了很大的变化。
” 2016年,虚拟人的商业模式出现了差异化。
目前已经确定了三种相对成熟的模式:一是基于元宇宙时期的IP模式,产品定位为多元偶像、娱乐、科研、教育等。
由此衍生出虚拟偶像、数字宇航员、品牌代言人等一系列将偶像身份具体化并通过IP打造和运营的角色,如刘夜兮、洛天依等;第二类是功能型虚拟人,也叫服务型服务,以数字化员工、虚拟主播、数字化客服等为代表,辅助人类在金融、文旅、零售、直播等领域的工作,减少企业成本,并提供自动化、标准化、智能化服务;第一章 第三类是正在探索的虚拟阿凡达(Avatar),也称为虚拟空间身份代理。
它为玩家创造了特定的游戏身份、虚拟音乐会观众、不朽形象等。
主要用在游戏、VR、元宇宙等方面。
它是一个虚拟空间,通过与真实空间的交互入口,玩家不仅可以拥有虚拟形象,还可以促进虚拟内容的生产,这也是虚拟人最终想要达到的状态。
沙利文和头报研究院的数据显示,很多品牌都在探索如何利用虚拟人产生更大的价值。
其中,虚拟歌手、明星克隆人、消费品牌虚拟代言人等在网络上迅速走红。
郭德纲说英语,泰勒·斯威夫特说四川话,AI“复活”了张国荣和梅艳芳,还为众多歌手开启了线上演唱会。
短视频的表情包和传播加速了虚拟人进入公众视野,C方的热情也体现了B方的需求。
年初,大V抖音刘润推出了数字人短视频;年底,拥有万粉丝的科普博主颜伯君开始在多个社交媒体平台发布硅基智能生产的数字人。
。
严伯峻在接受采访时也表示:“当我第一次发布AI制作的内容时,有观众敏锐地指出:‘你为什么不眨眼?’事实上,从动作、表情、语言到思维,AI不断发展。
据了解,2020年8月,该公司与明星MCN公司千寻成立合资公司千语智能,发布了AI数字真人直播解决方案。
千寻主播的数字化身,在主播直播8小时之外继续为主播直播,延长直播时长,另一方面更注重虚拟人自身的营销中心。
某医疗机构每个月需要上千个话题、热点、科普视频用于各类视频平台的运营和营销,目前每个月的生产能力是几百个。
一站式AIGC视频创作平台,图文内容一键生成3D视频,无需视频拍摄和制作。
使用友研后,营销中心解决了产能不足的问题。
,实现独立完成全平台视频矩阵运算。
还可以创作大量优质科普内容进行分发和获客,实现高质量医疗科普视频的快速、规模化量产。
不仅团队生产能力得到大幅提升,获客ROI也得到提升。
更重要的是,2009年,虚拟人开始进军各个行业,从影视、娱乐等领域,到金融、文旅、教育、政企等数字化深水领域。
▲图片来源:腾讯《数字人产业发展趋势报告》 举几个例子,在虚拟人+教育领域,网易有道发布了AI口语老师,为学生提供了开放的聊天场景,更符合真实的口语交流环境,并在对话结束时结束对话。
然后快速生成结果报告;科大讯飞发布科大讯飞认知大模型,内容涵盖批改中英文作业、模拟与英语口语老师的真实对话等。
虚拟人+政务方面,厦门、深圳、江西等地目前正在引入数字化员工。
他们的工作包括多语言政策解读以及为公众提供可以在聊天时完成的数字政府服务。
通过虚拟人智能推送服务门户,完成业务咨询、信息推送、服务指导等政务服务。
今年,一些厂商也逐渐试水数字人+跨境电商。
硅智告诉我们:“由于海外多语言对短视频和直播的门槛较高,我们开发了硅语言翻译小程序和Anylang专业版,通过实时翻译结合数字人可以解决这个问题,帮助跨境电商企业一站式出海。
“总体而言,经历了2017年的动荡期后,虚拟人的技术、产品和产业结构已经迈向了一个新的节点。
2018年,随着多模式、大规模模式的成熟,虚拟人可能会迈向更高的高度”。
同时,其在数千个行业的逐步渗透也将为更多数字化打开大门。
【本文经投资界合作伙伴Quadrant授权发布】如有任何疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-08
06-17
06-18
06-18
最新文章
3月,腾讯《王者荣耀》在全球App Store和Google Play吸引了2.57亿美元,同比增长63%
生鲜传奇宣布完成数亿元B+轮融资
裁员20%?红杉中国回应:胡说,员工总数不降反升
第二次影视创新“闯”短剧世界:看、留、跳都是钱
ASML:从飞利浦弃儿到光刻之王
宁康瑞珠获数千万元A轮融资 横琴金投、翰颐资本投资
智能金融服务生态平台科客完成A+轮融资
拼多多九鼎:信息披露无懈可击,竞争对手才是“浇水”的