首页 > 科技未来 > 内容

AI 生成的视频：有点惊人，有点令人震惊

发布于：2024-06-18 编辑：匿名来源：网络

AI 生成的视频正在入侵互联网。

此前，我们看过完全由AI制作的科幻预告片《Trailer：Genesis》，以及AI合成的《芭比海默》预告片。

这两部富有想象力的电影让我们看到了人工智能的魔力。

现在，越来越多的AI视频工具被开发出来，用于批量生产短视频和电影片段。

生成效果惊人，但使用门槛低至“离谱”。

不需要复杂的代码或深奥的说明。

只需一句话或一张图片，AI就能自动生成动态视频。

如果你想改变，只需要一句话就能告诉你要改变哪里。

喜欢制作视频的同学再也不用去找素材、熬夜剪辑了。

在创投圈，视频生成AI正在取代大型语言模型，成为近期最热门的赛道。

前段时间从这个行业出来的皮卡，又给这把火添了一把柴。

AI视频之风还能持续多久？ 1. AI生成视频，这次有一些特别之处。

使用AI生成视频并不难。

区别在于生成的视频类型。

经常剪辑视频的人可能都知道“一键电影制作”。

通过将脚本输入到编辑等视频工具中，系统可以直接生成与脚本匹配的视频。

在一些数字人平台上上传照片，AI就会生成数字人。

它可以在口播时自动口型同步。

这就是AI，但不是我们今天说的AI。

本文所说的AI生成视频是指生成具有连续逻辑的视频，内容之间存在关联性和协同性。

它不根据脚本将图片素材拼接成视频形式，也不用程序驱动数字人“动嘴”。

它更接近“无中生有”，也更难实施。

该视频体现了两个重要的功能：一键换装，一键添加或删除物品。

这也是Pika在推出1.0版本时重点关注的功能。

在皮卡的宣传视频中，只需一句输入指令，就可以给猩猩戴上墨镜，给行走的女士换衣服。

这件事情的厉害之处不是换衣服，而是换衣服的方式——用自然语言给出指令，而且整个过程非常流畅，没有违和感。

通过人工智能，人们可以轻松地编辑和重建视频场景。

AI还可以改变视频的风格，包括动画、卡通和电影。

例如，它可以将现实生活中的镜头转换成卡通世界。

它的效果有点类似于P图软件的滤镜，但更高级。

如今，人工智能生成的视频可以达到以假乱真的效果。

国内仍有不少企业在开发更新的技术。

这两排人物中，每一排六个人物的动作都一模一样，仿佛是“同一个模子里刻出来的”。

没错，它们是通过角色静态图片和绑定骨骼动画生成的。

这是阿里研究院正在进行的一个项目，叫做Animate Anybody，可以让任何人动起来。

除了阿里巴巴之外，字节跳动等公司也在开发类似的技术，而且技术迭代很快。

2、效果很好，但不要高兴得太早。

用简单的自然语言让AI生成定制视频，将会给业界带来和去年ChatGPT一样的兴奋。

Vincent视频的原理与Vincent图像类似，但由于视频是连续的多帧图像，因此相当于给图像增加了一个时间维度。

就像快速翻阅一本漫画书一样。

每页上的静止图像相连，人物和场景“移动”，形成时间连续的肖像动画。

华创资本投资人张晋分析“定焦”。

视频是逐帧合成的。

例如，如果一帧中有24张图片，那么AI会在很短的时间内生成24张图片，尽管它们具有共同的参数。

，但图片之间的连贯性和自然过渡仍然很难。

目前主流的Vincent视频模型主要依赖于Transformer模型和扩散模型。

通过Transformer模型，文本输入后可以转换为视频token，特征融合后可以输出视频。

扩散模型在文森图上添加时间维度，实现视频生成。

其优势在于语义理解、内容丰富。

现在许多制造商都采用扩散模式。

Runway的Gen2和Meta的Make-A-Video都是这方面的代表。

然而，就像任何技术一样，刚投入生产时，它会令人眼花缭乱，也会存在一些漏洞。

Pika、Runway等公司在宣传视频中展现了惊人的效果。

我们相信这些演示是真实的，也确实有人在测试中达到了类似的效果，但问题也很明显——输出不稳定。

无论是昨天的明星Gen-2，还是现在流行的炸鸡皮卡，这个问题都存在。

这是几乎所有大型模型的通病。

在ChatGPT等大型语言模型上，体现为无意义；在文森特视频模型上，它让人笑或哭。

瀚豪科技CEO吴洁谦告诉《钉教》，可控性是文森视频最大的痛点之一。

很多团队都在做针对性的优化，试图让生成的视频尽可能的可控。

张进表示，AI生成视频确实很难。

AI不仅要理解用户输入的语义，还要具有图片之间的语义连贯性。

人工智能视频的评价标准通常有三个主要维度。

首先是语义理解能力，即AI能否准确识别用户指令。

你要求它生成一个女孩，它生成一个阿姨，你要求一只猫坐飞机，它会让一只猫出现在飞机顶部。

这都是由于认识不够造成的。

其次是视频生成效果，比如画面流畅度、人物稳定性、动作连贯性、光影一致性、风格准确度等。

以前很多生成的视频都存在屏幕抖动、闪烁、变形、掉帧等问题。

如今技术进步了，但字符的稳定性和一致性仍需提高。

另外，如果画面主体动作幅度较大，也容易“暴露”。

比如，转身的女孩可能有鹅蛋脸、大饼脸，或者奔跑的马甩出“无影腿”。

另一点是产品的易用性。

AI生成视频*的革命之一是它显着降低了使用门槛。

只需输入少量信息即可实现丰富的效果。

过去，视频工作者使用PR、AE制作视频，必须点击各种复杂的操作界面。

按钮来调整大量参数，现在您只需键入即可。

产品是否易用是技术能否大规模普及的重要前提。

AI图像放大最近被人们“玩坏了”，也是因为操作简单，但效果感人。

当普通新手能够发布视频和照片时，那么爆款产品的诞生就离我们不远了。

目前来看，上述三个指标都取得了长足的进步，尤其是刚刚推出的皮卡1.0，各方面表现均衡。

然而，输出不稳定仍然是一个普遍问题。

视频长度也是一个很大的限制。

目前主流的文胜视频产品，正常生成的视频长度一般为3~4秒，最长不超过30秒。

生成视频的时间越长，对AI的理解和生成能力的要求就越高，泄密的概率就越大。

因此，很多人不得不采用“笔芯”的方法，将其与其他材料结合起来，才能达到理想的效果。

在两个预告片《芭比海默》《Trailer：Genesis》中，作者使用了Midjourney（图像处理）、Gen-2（视频处理）、CapCut（视频编辑）等多种工具。

吴洁谦表示，AI文胜视频产品目前市面上最多只能生成十几秒的视频。

瀚浩科技即将推出的产品将尝试生成任意长度的短视频，比如15秒短视频、1分钟左右。

戏剧性，这也可以成为一个差异化特征。

所以目前来说，依靠AI直接生成一整部大片还为时过早。

3.争夺AIGC的最后一块拼图。

在AIGC的各大细分领域中，AI文胜视频被认为是最后一块拼图，也是多模态AI创作的“圣杯”。

整个行业的热潮逐渐从文胜文、文胜图片转移到文胜视频领域。

Runway是一家成立于2001年的美国公司，曾引领AI生成视频的浪潮。

Gen-1于今年2月推出，专注于将视频转换为视频，并且可以改变视频风格； Gen-2于三月份推出，可以使用文本、图像或视频剪辑生成新视频。

Gen-2将生成视频的最大长度从4秒增加到18秒，并且还可以控制“镜头”并使用“运动画笔”随意指挥移动。

它曾经是Vincentian视频领域最先进的模型。

Runway的创始团队拥有深厚的电影、电视、艺术背景，因此其客户主要是电影级的视频剪辑师和制作人，他们的技术已经应用于好莱坞大片《瞬息全宇宙》。

下半年，Runway完成超1亿美元融资，公司估值超15亿美元。

最新的玩家是皮卡。

该公司由两位中国女博士创立。

在美国辍学的学生。

公司成立仅8个月，现有员工4人。

皮卡进步很快。

文森特新视频工具Pika 1.0于11月底发布，迅速在各大社交媒体上流行起来。

再加上创始人女主爽文的人物设计，被国内媒体疯狂报道。

一位AI创业者告诉《鼎教》，皮卡采取了差异化的方式，专注于动画生成，避免了AI生成视频在保真度和真实性方面的缺点。

另外，在Pika正式推出1.0版本之前，已经在discord中积累了一定数量的用户。

除了这两家公司之外，AI视频领域的玩家还包括Stability AI。

其最著名的产品是 Vincent 图片应用程序 Stable Diffusion。

11月，刚刚发布了自己的*Vincent视频模型Stable Video Diffusion； Meta 发布 Make-A- Video；谷歌推出了 Imagen Video 和 Phenaki。

中信建设投资走势图国内进展较为缓慢，尚未出现明星产品。

已经推出或正在开发文胜视频应用的公司包括右脑科技、胜数科技、万兴科技、美图等。

其中，右脑科技的视频功能将于8月开放内测应用。

这是一家年轻的公司，今年9月才成立，已经获得了奇绩创坛、光速光合作用的投资。

圣数科技今年3月才成立，由RealAI、蚂蚁金服和百度创投共同孵化。

也有一些企业善于挖掘热点，无论是主动还是被动。

在皮卡被媒体炒作的日子里，A股上市公司新雅达股价暴涨，连续六个交易日逼近涨停，累计涨幅接近一倍。

这仅仅是因为皮卡创始人郭文静是新雅达实际控制人郭华强的女儿。

两家公司没有业务往来，新雅达也没有AI视频生成相关的产品和业务。

炒概念一直是资本市场的通病。

该集团今年6月发布大型模型产品时，还展示了文森视频功能，声称是“国内唯一实现文森视频功能的大型模型产品”和“最先进的之一”世界人工智能技术。

”当然，我们不知道有多少人会相信这些自称的标题，也不知道有多少人会使用这些产品。

在图片领域具有优势的美图公司也在皮卡推出一周内发布了MiracleVision 4.0版本的大比例视觉模型。

主要功能是AI视频。

不过这些功能目前还没有推出，未来几年将逐步应用到美图秀秀等产品中。

AI行业太吵闹了，我们常常分不清哪些公司是在做产品，哪些公司是来炒股的。

抛开这些杂音，AI文胜视频技术本身就不错，有望推动生产力革命，加速AIGC技术的产业化。

中信证券认为，文森视频有望在短视频和动画两个领域率先落地，短视频制作中的传统实拍模式有望被生成技术取代。

也许用不了多久，短视频就不再需要真人出现、拍摄和录制。

这不仅仅意味着口头场景，而是任何你能想象到的场景，以及很多你无法想象的图像。

AI 生成的视频：有点惊人，有点令人震惊

随后，AI生成的视频大规模入侵互联网，AI像流水线一样批量生产短视频。

短视频的游戏规则也将改变。

【本文经投资界合作伙伴微信公众号授权：顶角一号。

本平台仅提供信息存储服务。

】如有任何疑问，请联系投资界（）。

站长声明

标签：

上一篇：上半年上海生物医药产业规模同比增长22.8%，力争到2025年达1.2万亿元

下一篇：银正基因完成新一轮融资，专注下一代基因编辑工具

为什么其他保险公司会向员工赠送 50,000 块 Apple Watch，并且还免费开发一系列健康应用

免费赠送 50,000 块 Apple Watch？您确定您收到的不是 Apple Watch 型号吗？您还需要支付运费吗？是的，真的有这么有钱的公司。周二，美国保险金融集团（Aetna）宣布将于今年秋季开始与苹果合作。安泰近5万名员工将有资格免费获得Apple Watch，甚至与安泰合作的企业客户也将

06-18
外媒：三星将于2022年底推出200层以上的第8代NAND闪存

据businesskorea报道，三星电子将在年底推出200层以上的第8代NAND闪存。 Businesskorea援引业内人士的话预测，三星将在单芯片存储器之上叠加96层，推出第一层NAND闪存。与上一代Layer NAND产品相比，Layer NAND闪存可将生产效率和数据传输速度提高30%。 Businesskorea报道称

06-08
独家-国内营收或加速，耐克入驻拼多多

雷峰网独家获悉，Nike Outlet旗舰店近期或将入驻拼多多。知情人人士向雷峰网透露，今年下半年，拼多多考察了以耐克为首的鞋服品牌。其中还包括波司登、雅戈尔等顶级品牌。对于与耐克的合作，目前的策略是参考斯凯奇的模式，首先以直营店的形式进入市场。这与拼多多从今年

06-17
摩根传动完成近亿元Pre-A轮融资，创始人12月3日从国内传动龙头

投资界（ID：pedaily）获悉消息，近日，摩根大通传动宣布完成近亿元Pre-A轮融资。，本轮融资由野草创投领投，川商创投基金、鼎坤一号基金跟投。本轮融资将用于摩腾传动产品研发、深化行业应用、扩大品牌影响力和市场份额等。创始人和摩腾传动董事长侯文科表示，“本轮融资

06-17
在银行APP卖奢侈品，PaaS平台“银奢inLUXE”获数百万元种子轮融资

投资社区（ID：pedaily）9月21日消息，奢侈品PaaS平台“银奢inLUXE”近日完成数百万人民币融资种子轮融资种子轮融资，投资方为奢侈品行业高管，本轮融资将用于业务扩张和产品研发。银奢inLUXE于今年3月正式开始运作。率先进驻国内数十家银行APP分期商城，为一线品牌提供线

06-17
2017阿里巴巴封神之战-福建赛区，硝烟再次升起~

阿里巴巴封神之战全球创客大赛始于2017年，是阿里巴巴集团面向全球创客社区举办的系列赛事。大赛由阿里巴巴创新中心（AIC）主办，联合全球多个国家和地区、全球知名媒体、全球知名创投机构、数十家全球顶级合作伙伴，打造“互联网”精英团队创业大赛。今年的福建赛区由厦门

06-18
成立十年，国药资本今天正式更名

对于一个公司来说，成立十年意味着它已经逐渐成熟，具备了持续成功的基础。成立于2001年的国药资本决定以全新的品牌形象迎接第十个十年。 2019年1月19日，国药资本宣布正式更名为“健一资本”，并在行业内率先提出“创新+融合”的投资理念，打造两轮核心竞争力“产业+资本”

06-17
耀明环保完成数千万元Pre-A轮融资，由坤高新创投

投资圈领投（ID：pedaily）据2月22日消息，工业污染控制及废水处理技术公司“耀明环保”近日完成数千万元Pre-A轮融资，由坤高新创投领投，绿叶投资等机构跟投。苏州耀明环保科技有限公司成立于2001年，创始人及CEO王磊、联合创始人鲁鹏硕士毕业于清华大学。在清华大学研究生

06-17
神舟电脑第四次提交创业板上市申请，目前正在进行初审

2月21日上午，创业板发行监管部公开信息显示，神舟电脑再次提交创业板上市申请，目前正在审核中处于初步审查阶段。　　据悉，这是神舟电脑第四次申请上市。神舟电脑前三次申请均以失败告终——2009年，神舟电脑赴港上市计划搁浅； 2009年，深圳中小板因金融危机陷入搁浅；

06-18
米聊“复活”-微信表情采取“禁烟”行动-Apple Glass专利可自动清洁镜片

早报称Facebook侵犯用户隐私赔偿用户6.5亿美元苹果Apple Glass专利可自动清洁镜片国寿举报人发声再次在中国互联网上普及率为70.4%。 Apple 训练 Siri 更好地理解口吃的用户。三星推出PC消息应用MiLiao“复活”：成为语音聊天应用。淘票票响应免费退款功能。 SpaceX 指责亚马

06-21
据悉，俏江南已提交上市申请，融资300至4亿美元

3月21日，据港媒报道，据市场消息，俏江南近日已向港交所提交上市申请交易所并已聘请瑞银和派杰亚洲为安排人，初步计划融资300美元至4亿美元，暂定于今年第二季度在香港上市。　　据香港《明报》报道，内地中式餐厅运营商俏江南已正式进驻香港。据市场人士透露，俏江南已于

06-17
全年投资5笔，海南自贸港基金新增投资3名GP，

海南自贸港基金再出手，今年已是第五次。投资圈-解码LP消息，12月16日，海南金融集团发布《关于海南自由贸易港建设投资基金拟投资设立子基金的公示》显示，海南自贸港基金已选定3只拟投资子基金，投资规模达6.86亿元。具体来说，我们看一下这三个子基金： 1、华能长富清洁能

06-18