首页 > 科技未来 > 内容

正因为如此,马斯克与兵马俑共舞《科目三》

发布于:2024-06-21 编辑:匿名 来源:网络

一张照片就能让马斯克、梅西等大名人们神奇起舞,甚至可以安排全网火爆的科目三。

这不是什么先进的人工智能技术。

阿里巴巴统一钱文在移动端新增加的“全民舞王”功能就可以实现。

还有科目三、DJ慢摇、鬼步舞、极乐舞等12种流行舞蹈模板。

你选择吧。

在统一千文中输入“全民舞王”、“通义舞王”等密码,然后在跳跃界面选择自己喜欢的舞蹈并上传全身照片。

只需十分钟,一个身体素质与精神素质兼具的舞王就会诞生。

华丽的“瞬间”。

没想到浓眉大眼的爱因斯坦瞬间就能变身潮流男,而且动作节奏也不算太强。

▲ 图片来自:Simon_Awen 兵马俑和舞王只差一张照片,这姿势可不是你能掩盖的。

人偶界舞王称霸,他们怎么能忽视我这个“亚洲舞王”尼古拉斯赵四呢? ▲ 图片来自:工夫财经。

在这张随意画的图中,小人物跳得比我好。

看来我得报名参加舞蹈班了。

▲ 图片来自:胡哥谈蜡笔小新的“抓抓摆姿势”,瞬间回到了童年。

▲ 图片来自:盘花狗让照片“活”起来的AI魔法 那么阿里巴巴的AI研究团队是如何让照片动起来的呢?通义舞王功能的发布实际上是AnimateAnyone技术的具体应用和实现。

阿里巴巴人工智能研究团队发布的论文显示,扩散模型是目前视觉生成研究领域的主流。

然而,在图像到视频生成领域,仍然存在局部失真、细节模糊、帧率抖动等问题。

对此,阿里巴巴人工智能研究团队基于扩散模型提出了一种新的人工智能算法Animate Anybody。

该算法的功能是将静态的角色图像转换为动画视频,同时可以通过输入姿势序列来精确控制视频中的角色动作。

▲翻书原理展示。

图片来自:@flipping book Andy Andymation 需要注意的是,在视频制作,尤其是动画制作中,人物的动作都是通过逐帧转场来完成的。

原理和我小时候经常玩的翻翻书类似。

翻开书本,每一页都是静态的手绘稿。

快速翻阅它可以让图片通过人眼的“视觉暂留”bug而移动。

制作一个画面动起来最大的困难来自于“想象”接下来的动作和场景,前后没有任何参考。

因此,在官方的对比展示中,可以看到传统技术“DisCO”多次被批评为反面教材。

其严重的扭曲效果只能让主体移动,但扭曲的体形和奇怪的运动效果根本不值一提。

工作。

因此,为了解决视频人物图像一致性问题,他们引入了参考图像网络ReferenceNet,可以捕获参考图像中的空间细节信息。

然后,他们将ReferenceNet与UNet结合起来,让UNet了解生成目标图像时应该在哪里生成哪些细节,从而使生成的图像能够整体去除噪声,同时保留参考图像中的关键细节。

实现人物形象的一致性。

除了捕捉细节之外,还要保证姿势的可控性。

为此,阿里巴巴AI团队还设计了一款轻量级的姿势引导器——Pose Guider,它在去噪过程中集成了姿势控制信号,以保证生成的动画序列符合指定的姿势。

考虑到视频的稳定性,他们还引入了时序生成模块,让模型能够学习帧之间的连接,这样生成的视频就会流畅连贯而不是支离破碎,同时保持高分辨率的细节让画面质量更好并且更加稳定。

与以往的方法相比,该方法能够有效保持视频人物外观的一致性,不存在改变衣服颜色等问题。

同时,视频流畅清晰,无闪烁、抖动,还支持任意角色的动态动画。

改变。

比如梅西就玩出了中老年人喜爱的顶级风格,举手打招呼。

二维人物在静止状态下移动,跳起室内舞时,给人的印象不亚于真人。

就连钢铁侠也来凑热闹,健身锻炼肌肉,也没有什么问题。

在AI视频生成领域,阿里巴巴背后的技术积累远不止于此。

例如,上个月,阿里巴巴还发布了另一款视频生成技术DreaMoving。

这是一个基于扩散的可控视频生成框架,用于生成高质量的定制人像视频。

该技术的优点是不需要深入了解复杂的视频制作技术。

用户只需给予一些指导,例如一段文字或参考图像,DreaMoving 就可以创建高度逼真的视频。

也就是说,只要给出目标身份和姿势序列,DreaMoving就可以根据姿势序列生成任何人/物体在任何地方跳舞的视频。

简单来说,DreaMoving可以通过简单的输入,如人脸图像、动作序列和文字等,自动生成各种定制的角色视频,实现对视频生成的精确控制。

具体拆解步骤:首先输入一个人的面部图像,生成视频中人的全身图像,然后输入姿势序列,精确控制视频中人物的动作,最后输入文字,更全面地控制视频生成影响。

比如,一个女孩,微笑着,站在海边的沙滩上,穿着浅黄色的长袖连衣裙。

一名身穿西装、打着蓝色领带的男子在埃及金字塔前跳舞。

法国小镇上,一位穿着浅蓝色连衣裙的女孩微笑着跳舞。

AI视频生成行业已经疯狂。

事实上,在生成式AI领域,AI视频生成领域的起点并不算晚。

在ChatGPT Sora诞生之前,很多厂商就已经押注了这条赛道。

微软、谷歌等都推出了类似的AI视频生成工具,但收效甚微。

基于整个行业长期的技术积累,扩散模式的出现让厂商看到了AI视频生成的潜在前景。

与RNN等早期模型相比,它具有明显的优势。

它可以生成更加连贯、清晰的图像或视频序列,加快视频生成的迭代过程。

市面上的主流工具也在此基础上做出了巨大的补充,使得AI视频生成赛道再次掀起波澜,真正呈现出惊人的爆发趋势。

去年年底,《Runway Gen-2》进行了重大更新,分辨率提升至4K,视频生成效果的保真度和一致性有了重大突破。

一周后,动笔功能再次上线。

只需一支笔,就能让静止的事物动起来。

紧接着,文胜图的“领头羊”Stability AI也发布了Stable Video Diffusion,为AI视频生成领域再添热潮。

而Pika 1.0则凭借更简单的视频生成、易于理解的部分视频编辑以及更高质量的视频生成,一经亮相就赢得了众多硅谷大亨的青睐。

从生成到后期制作,您可以自己完成一站式操作。

李飞飞团队与谷歌合作推出的W.A.L.T模型还可以根据自然语言/图片提示生成逼真的2D/3D视频或动画,生成效果可与Runway、Pika等专家相媲美。

这些人工智能视频生成工具主要在质量和数量两个维度上取得了长足的进步。

在质量方面,这些AI产品不断引入更强大的模型架构,并使用更大规模、更高质量的数据进行训练,使得AI生成视频的图像质量、流畅度和保真度不断提高。

从数量上来说,生成的视频时长也在不断地卷进,突破到两位数秒的长度,场景和事件的组合也越来越丰富。

正因为如此,马斯克与兵马俑共舞《科目三》

未来,随着计算能力的进一步提高,将有可能生成持续数小时的高质量视频。

漂浮在云端的技术最终将落地应用,AI视频生成的兴起将创造巨大的蓝海市场。

依托深厚的技术积累,同艺倩文的《全民舞王》就是基于这一商业逻辑的又一产品。

这不仅将开启与阿里巴巴等公司的竞争,加速整个行业的进步,也让我们有机会体验到AI视频生成技术带来的更多可能性。

正因为如此,马斯克与兵马俑共舞《科目三》

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 普洛斯ASP管理园发布首份可持续发展报告

    普洛斯ASP管理园发布首份可持续发展报告

    投资界(ID:pedaily)据8月3日消息,普洛斯中国最大的基础设施资产管理服务公司——普洛斯资产运营服务(以下简称“普洛斯ASP”)上海安博ASP管理园ESG实践成果发布会。 其管理的甘肃公航路金融仓储基地获得英国建筑研究院(BRE)颁发的绿色建筑运营标准BREEAM In-Use“杰出

    06-17

  • 雾芯科技2020年由盈转亏,营收同比增长146.5%至38亿元

    雾芯科技2020年由盈转亏,营收同比增长146.5%至38亿元

    美股上市公司雾芯科技(RLX.US)发布四季度及全年财报报告。 财报显示,雾芯科技第四季度营收16.2亿元,同比增长44.5%;毛利率为42.9%,去年同期为39.1%;净亏损2.4亿元,而去年同期净利润1万元。

    06-17

  • 春秋航空99元的机票真的便宜吗

    春秋航空99元的机票真的便宜吗

    中秋国庆节到了,又有心情去旅行了。 高铁一票难,普通飞机又贵,低成本航空公司的好处写在名字上:机票便宜。 然而,一些经历过的人却觉得低廉的票价令人沮丧,并愤怒地称其为“天上的绿皮”。 如果您在没有阅读说明的情况下乘坐廉价航空公司的航班,您不会觉得自己省了钱。

    06-21

  • 耀明医疗完成近5亿元D+轮融资,云峰基金领投

    耀明医疗完成近5亿元D+轮融资,云峰基金领投

    据3月15日消息,上海耀明医疗科技有限公司(以下简称:耀明医疗)公告完成总额近5亿元的D+轮融资。 本轮投资由云锋基金领投,弘晖资本、江苏瑞华资本、八方资本、易方达基金、领道资本等跟投,百榕资本担任独家投资方。 作为国内领先的平台型创新医疗器械研发及产业化公司,耀

    06-17

  • 东南亚网约车公司巨头Gojek获12亿美元融资

    东南亚网约车公司巨头Gojek获12亿美元融资

    据投资界消息,据外媒报道,东南亚网约车公司巨头Gojek融资12亿美元用于扩张,确保资金与竞争对手 Grab 竞争。 不过,Gojek并未具体说明他的新资金将来自哪里。 但有传言称,亚马逊是有兴趣加入此轮融资的公司之一。 据报道,随着冠状病毒大流行加速并引发全球股市暴跌,新一

    06-17

  • 风火地完成新一轮战略融资

    风火地完成新一轮战略融资

    据投资界10月21日消息,据36氪报道,专注于服务线下中小微企业的风火地近日完成新一轮战略融资,投资人为云曦一号基金。 风火地隶属于杭州蓝川科技有限公司,最初为淘宝“不需要ERP的小电商”提供电商SaaS服务,包括店铺管理、订单处理等。 2017年,在保留其电商SaaS业务方面

    06-17

  • 一汽解放:公司今年累计销量120772辆,同比增长60.93%

    一汽解放:公司今年累计销量120772辆,同比增长60.93%

    一汽解放公告,公司2月份汽车产量8辆,今年累计产量1辆,同比增长78.96%; 2月份汽车销量为0辆,今年累计销量为72辆,同比增长60.93%。

    06-17

  • 深耕三维视觉全栈技术和产品,“陆神视”获超1.5亿元B轮融资

    深耕三维视觉全栈技术和产品,“陆神视”获超1.5亿元B轮融资

    据投资界(ID:pedaily)1月5日消息,据工业界而商业信息显示,卢绅士新年新增更多投资人。 据悉,鲁深石新引入的投资者包括:国科新能源、红砖东方、华安紫园、合肥创新投资、众安资本等,B轮融资超1.5亿元并已完成。 本轮融资将用于市场拓展和供应链完善。 安徽陆神视科技

    06-18

  • 比利时累计光伏装机容量达到7GW里程碑

    比利时累计光伏装机容量达到7GW里程碑

    根据比利时能源社区协会发布的最新数据,比利时去年安装了约MW的新光伏系统,而2017年和2018年分别新增光伏装机容量1,500MW。 兆瓦、兆瓦和兆瓦。 加上去年的新增装机,比利时累计光伏装机容量超过7GW。

    06-08

  • 云信达获1亿元B轮融资,由SIG海纳亚洲

    云信达获1亿元B轮融资,由SIG海纳亚洲

    投资界(ID:pedaily)7月15日消息,近日,云信达科技宣布完成1亿元B轮融资,本次融资由SIG海纳普亚领投,南京高新创投、中南投资跟投,老股东联想创投继续跟投。 云信达科技CEO张兵表示,本轮融资将主要用于CDM技术研发,立足信息产业创新生态,打造世界一流的CDM产品。 同时

    06-17

  • 关联交易是否涉及利益输送?融智日新回复科创板IPO问询

    关联交易是否涉及利益输送?融智日新回复科创板IPO问询

    2月10日,我们获悉,安徽融智日新科技股份有限公司(以下简称:融智日新)于2月10日回复科创板IPO 2 月 9 日 问。 本轮问询中,上交所关注了融智日新股权结构、技术、业务等六大问题,共涉及25个问题。 听,中小企业反馈平台。 倾听用户需求,倾听创业者声音,解决中小企业痛

    06-18

  • 「华宇安」获数千万元A轮融资

    「华宇安」获数千万元A轮融资

    一家专注于漏洞管理和AI攻防的安全厂商,北京华宇安信息技术有限公司正式完成数千万元A轮融资融资。 本轮投资方为知名风投机构DCM,Crypto Capital担任独家投资方。 本轮融资后,公司计划继续提升技术实力和产品能力,夯实人才梯队建设,持续打造云原生安全生态,强化漏洞管理

    06-18