“风驰计划”再次升级!阿里云优惠券申请零!零!零!门槛
06-18
AI 生成的视频正在入侵互联网。
此前,我们看过完全由AI制作的科幻预告片《Trailer:Genesis》,以及AI合成的《芭比海默》预告片。
这两部富有想象力的电影让我们看到了人工智能的魔力。
现在,越来越多的AI视频工具被开发出来,用于批量生产短视频和电影片段。
生成效果惊人,但使用门槛低至“离谱”。
不需要复杂的代码或深奥的说明。
只需一句话或一张图片,AI就能自动生成动态视频。
如果你想改变,只需要一句话就能告诉你要改变哪里。
喜欢制作视频的同学再也不用去找素材、熬夜剪辑了。
在创投圈,视频生成AI正在取代大型语言模型,成为近期最热门的赛道。
前段时间从这个行业出来的皮卡,又给这把火添了一把柴。
AI视频之风还能持续多久? 1. AI生成视频,这次有一些特别之处。
使用AI生成视频并不难。
区别在于生成的视频类型。
经常剪辑视频的人可能都知道“一键电影制作”。
通过将脚本输入到编辑等视频工具中,系统可以直接生成与脚本匹配的视频。
在一些数字人平台上上传照片,AI就会生成数字人。
它可以在口播时自动口型同步。
这就是AI,但不是我们今天说的AI。
本文所说的AI生成视频是指生成具有连续逻辑的视频,内容之间存在关联性和协同性。
它不根据脚本将图片素材拼接成视频形式,也不用程序驱动数字人“动嘴”。
它更接近“无中生有”,也更难实施。
该视频体现了两个重要的功能:一键换装,一键添加或删除物品。
这也是Pika在推出1.0版本时重点关注的功能。
在皮卡的宣传视频中,只需一句输入指令,就可以给猩猩戴上墨镜,给行走的女士换衣服。
这件事情的厉害之处不是换衣服,而是换衣服的方式——用自然语言给出指令,而且整个过程非常流畅,没有违和感。
通过人工智能,人们可以轻松地编辑和重建视频场景。
AI还可以改变视频的风格,包括动画、卡通和电影。
例如,它可以将现实生活中的镜头转换成卡通世界。
它的效果有点类似于P图软件的滤镜,但更高级。
如今,人工智能生成的视频可以达到以假乱真的效果。
国内仍有不少企业在开发更新的技术。
这两排人物中,每一排六个人物的动作都一模一样,仿佛是“同一个模子里刻出来的”。
没错,它们是通过角色静态图片和绑定骨骼动画生成的。
这是阿里研究院正在进行的一个项目,叫做Animate Anybody,可以让任何人动起来。
除了阿里巴巴之外,字节跳动等公司也在开发类似的技术,而且技术迭代很快。
2、效果很好,但不要高兴得太早。
用简单的自然语言让AI生成定制视频,将会给业界带来和去年ChatGPT一样的兴奋。
Vincent视频的原理与Vincent图像类似,但由于视频是连续的多帧图像,因此相当于给图像增加了一个时间维度。
就像快速翻阅一本漫画书一样。
每页上的静止图像相连,人物和场景“移动”,形成时间连续的肖像动画。
华创资本投资人张晋分析“定焦”。
视频是逐帧合成的。
例如,如果一帧中有24张图片,那么AI会在很短的时间内生成24张图片,尽管它们具有共同的参数。
,但图片之间的连贯性和自然过渡仍然很难。
目前主流的Vincent视频模型主要依赖于Transformer模型和扩散模型。
通过Transformer模型,文本输入后可以转换为视频token,特征融合后可以输出视频。
扩散模型在文森图上添加时间维度,实现视频生成。
其优势在于语义理解、内容丰富。
现在许多制造商都采用扩散模式。
Runway的Gen2和Meta的Make-A-Video都是这方面的代表。
然而,就像任何技术一样,刚投入生产时,它会令人眼花缭乱,也会存在一些漏洞。
Pika、Runway等公司在宣传视频中展现了惊人的效果。
我们相信这些演示是真实的,也确实有人在测试中达到了类似的效果,但问题也很明显——输出不稳定。
无论是昨天的明星Gen-2,还是现在流行的炸鸡皮卡,这个问题都存在。
这是几乎所有大型模型的通病。
在ChatGPT等大型语言模型上,体现为无意义;在文森特视频模型上,它让人笑或哭。
瀚豪科技CEO吴洁谦告诉《钉教》,可控性是文森视频最大的痛点之一。
很多团队都在做针对性的优化,试图让生成的视频尽可能的可控。
张进表示,AI生成视频确实很难。
AI不仅要理解用户输入的语义,还要具有图片之间的语义连贯性。
人工智能视频的评价标准通常有三个主要维度。
首先是语义理解能力,即AI能否准确识别用户指令。
你要求它生成一个女孩,它生成一个阿姨,你要求一只猫坐飞机,它会让一只猫出现在飞机顶部。
这都是由于认识不够造成的。
其次是视频生成效果,比如画面流畅度、人物稳定性、动作连贯性、光影一致性、风格准确度等。
以前很多生成的视频都存在屏幕抖动、闪烁、变形、掉帧等问题。
如今技术进步了,但字符的稳定性和一致性仍需提高。
另外,如果画面主体动作幅度较大,也容易“暴露”。
比如,转身的女孩可能有鹅蛋脸、大饼脸,或者奔跑的马甩出“无影腿”。
另一点是产品的易用性。
AI生成视频*的革命之一是它显着降低了使用门槛。
只需输入少量信息即可实现丰富的效果。
过去,视频工作者使用PR、AE制作视频,必须点击各种复杂的操作界面。
按钮来调整大量参数,现在您只需键入即可。
产品是否易用是技术能否大规模普及的重要前提。
AI图像放大最近被人们“玩坏了”,也是因为操作简单,但效果感人。
当普通新手能够发布视频和照片时,那么爆款产品的诞生就离我们不远了。
目前来看,上述三个指标都取得了长足的进步,尤其是刚刚推出的皮卡1.0,各方面表现均衡。
然而,输出不稳定仍然是一个普遍问题。
视频长度也是一个很大的限制。
目前主流的文胜视频产品,正常生成的视频长度一般为3~4秒,最长不超过30秒。
生成视频的时间越长,对AI的理解和生成能力的要求就越高,泄密的概率就越大。
因此,很多人不得不采用“笔芯”的方法,将其与其他材料结合起来,才能达到理想的效果。
在两个预告片《芭比海默》《Trailer:Genesis》中,作者使用了Midjourney(图像处理)、Gen-2(视频处理)、CapCut(视频编辑)等多种工具。
吴洁谦表示,AI文胜视频产品目前市面上最多只能生成十几秒的视频。
瀚浩科技即将推出的产品将尝试生成任意长度的短视频,比如15秒短视频、1分钟左右。
戏剧性,这也可以成为一个差异化特征。
所以目前来说,依靠AI直接生成一整部大片还为时过早。
3.争夺AIGC的最后一块拼图。
在AIGC的各大细分领域中,AI文胜视频被认为是最后一块拼图,也是多模态AI创作的“圣杯”。
整个行业的热潮逐渐从文胜文、文胜图片转移到文胜视频领域。
Runway是一家成立于2001年的美国公司,曾引领AI生成视频的浪潮。
Gen-1于今年2月推出,专注于将视频转换为视频,并且可以改变视频风格; Gen-2于三月份推出,可以使用文本、图像或视频剪辑生成新视频。
Gen-2将生成视频的最大长度从4秒增加到18秒,并且还可以控制“镜头”并使用“运动画笔”随意指挥移动。
它曾经是Vincentian视频领域最先进的模型。
Runway的创始团队拥有深厚的电影、电视、艺术背景,因此其客户主要是电影级的视频剪辑师和制作人,他们的技术已经应用于好莱坞大片《瞬息全宇宙》。
下半年,Runway完成超1亿美元融资,公司估值超15亿美元。
最新的玩家是皮卡。
该公司由两位中国女博士创立。
在美国辍学的学生。
公司成立仅8个月,现有员工4人。
皮卡进步很快。
文森特新视频工具Pika 1.0于11月底发布,迅速在各大社交媒体上流行起来。
再加上创始人女主爽文的人物设计,被国内媒体疯狂报道。
一位AI创业者告诉《鼎教》,皮卡采取了差异化的方式,专注于动画生成,避免了AI生成视频在保真度和真实性方面的缺点。
另外,在Pika正式推出1.0版本之前,已经在discord中积累了一定数量的用户。
除了这两家公司之外,AI视频领域的玩家还包括Stability AI。
其最著名的产品是 Vincent 图片应用程序 Stable Diffusion。
11月,刚刚发布了自己的*Vincent视频模型Stable Video Diffusion; Meta 发布 Make-A- Video;谷歌推出了 Imagen Video 和 Phenaki。
中信建设投资走势图 国内进展较为缓慢,尚未出现明星产品。
已经推出或正在开发文胜视频应用的公司包括右脑科技、胜数科技、万兴科技、美图等。
其中,右脑科技的视频功能将于8月开放内测应用。
这是一家年轻的公司,今年9月才成立,已经获得了奇绩创坛、光速光合作用的投资。
圣数科技今年3月才成立,由RealAI、蚂蚁金服和百度创投共同孵化。
也有一些企业善于挖掘热点,无论是主动还是被动。
在皮卡被媒体炒作的日子里,A股上市公司新雅达股价暴涨,连续六个交易日逼近涨停,累计涨幅接近一倍。
这仅仅是因为皮卡创始人郭文静是新雅达实际控制人郭华强的女儿。
两家公司没有业务往来,新雅达也没有AI视频生成相关的产品和业务。
炒概念一直是资本市场的通病。
该集团今年6月发布大型模型产品时,还展示了文森视频功能,声称是“国内唯一实现文森视频功能的大型模型产品”和“最先进的之一”世界人工智能技术。
”当然,我们不知道有多少人会相信这些自称的标题,也不知道有多少人会使用这些产品。
在图片领域具有优势的美图公司也在皮卡推出一周内发布了MiracleVision 4.0版本的大比例视觉模型。
主要功能是AI视频。
不过这些功能目前还没有推出,未来几年将逐步应用到美图秀秀等产品中。
AI行业太吵闹了,我们常常分不清哪些公司是在做产品,哪些公司是来炒股的。
抛开这些杂音,AI文胜视频技术本身就不错,有望推动生产力革命,加速AIGC技术的产业化。
中信证券认为,文森视频有望在短视频和动画两个领域率先落地,短视频制作中的传统实拍模式有望被生成技术取代。
也许用不了多久,短视频就不再需要真人出现、拍摄和录制。
这不仅仅意味着口头场景,而是任何你能想象到的场景,以及很多你无法想象的图像。

随后,AI生成的视频大规模入侵互联网,AI像流水线一样批量生产短视频。
短视频的游戏规则也将改变。
【本文经投资界合作伙伴微信公众号授权:顶角一号。
本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-18
06-17
06-18
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态