首页 > 科技未来 > 内容

AI 生成的视频:有点惊人,有点令人震惊

发布于:2024-06-18 编辑:匿名 来源:网络

AI 生成的视频正在入侵互联网。

此前,我们看过完全由AI制作的科幻预告片《Trailer:Genesis》,以及AI合成的《芭比海默》预告片。

这两部富有想象力的电影让我们看到了人工智能的魔力。

现在,越来越多的AI视频工具被开发出来,用于批量生产短视频和电影片段。

生成效果惊人,但使用门槛低至“离谱”。

不需要复杂的代码或深奥的说明。

只需一句话或一张图片,AI就能自动生成动态视频。

如果你想改变,只需要一句话就能告诉你要改变哪里。

喜欢制作视频的同学再也不用去找素材、熬夜剪辑了。

在创投圈,视频生成AI正在取代大型语言模型,成为近期最热门的赛道。

前段时间从这个行业出来的皮卡,又给这把火添了一把柴。

AI视频之风还能持续多久? 1. AI生成视频,这次有一些特别之处。

使用AI生成视频并不难。

区别在于生成的视频类型。

经常剪辑视频的人可能都知道“一键电影制作”。

通过将脚本输入到编辑等视频工具中,系统可以直接生成与脚本匹配的视频。

在一些数字人平台上上传照片,AI就会生成数字人。

它可以在口播时自动口型同步。

这就是AI,但不是我们今天说的AI。

本文所说的AI生成视频是指生成具有连续逻辑的视频,内容之间存在关联性和协同性。

它不根据脚本将图片素材拼接成视频形式,也不用程序驱动数字人“动嘴”。

它更接近“无中生有”,也更难实施。

该视频体现了两个重要的功能:一键换装,一键添加或删除物品。

这也是Pika在推出1.0版本时重点关注的功能。

在皮卡的宣传视频中,只需一句输入指令,就可以给猩猩戴上墨镜,给行走的女士换衣服。

这件事情的厉害之处不是换衣服,而是换衣服的方式——用自然语言给出指令,而且整个过程非常流畅,没有违和感。

通过人工智能,人们可以轻松地编辑和重建视频场景。

AI还可以改变视频的风格,包括动画、卡通和电影。

例如,它可以将现实生活中的镜头转换成卡通世界。

它的效果有点类似于P图软件的滤镜,但更高级。

如今,人工智能生成的视频可以达到以假乱真的效果。

国内仍有不少企业在开发更新的技术。

这两排人物中,每一排六个人物的动作都一模一样,仿佛是“同一个模子里刻出来的”。

没错,它们是通过角色静态图片和绑定骨骼动画生成的。

这是阿里研究院正在进行的一个项目,叫做Animate Anybody,可以让任何人动起来。

除了阿里巴巴之外,字节跳动等公司也在开发类似的技术,而且技术迭代很快。

2、效果很好,但不要高兴得太早。

用简单的自然语言让AI生成定制视频,将会给业界带来和去年ChatGPT一样的兴奋。

Vincent视频的原理与Vincent图像类似,但由于视频是连续的多帧图像,因此相当于给图像增加了一个时间维度。

就像快速翻阅一本漫画书一样。

每页上的静止图像相连,人物和场景“移动”,形成时间连续的肖像动画。

华创资本投资人张晋分析“定焦”。

视频是逐帧合成的。

例如,如果一帧中有24张图片,那么AI会在很短的时间内生成24张图片,尽管它们具有共同的参数。

,但图片之间的连贯性和自然过渡仍然很难。

目前主流的Vincent视频模型主要依赖于Transformer模型和扩散模型。

通过Transformer模型,文本输入后可以转换为视频token,特征融合后可以输出视频。

扩散模型在文森图上添加时间维度,实现视频生成。

其优势在于语义理解、内容丰富。

现在许多制造商都采用扩散模式。

Runway的Gen2和Meta的Make-A-Video都是这方面的代表。

然而,就像任何技术一样,刚投入生产时,它会令人眼花缭乱,也会存在一些漏洞。

Pika、Runway等公司在宣传视频中展现了惊人的效果。

我们相信这些演示是真实的,也确实有人在测试中达到了类似的效果,但问题也很明显——输出不稳定。

无论是昨天的明星Gen-2,还是现在流行的炸鸡皮卡,这个问题都存在。

这是几乎所有大型模型的通病。

在ChatGPT等大型语言模型上,体现为无意义;在文森特视频模型上,它让人笑或哭。

瀚豪科技CEO吴洁谦告诉《钉教》,可控性是文森视频最大的痛点之一。

很多团队都在做针对性的优化,试图让生成的视频尽可能的可控。

张进表示,AI生成视频确实很难。

AI不仅要理解用户输入的语义,还要具有图片之间的语义连贯性。

人工智能视频的评价标准通常有三个主要维度。

首先是语义理解能力,即AI能否准确识别用户指令。

你要求它生成一个女孩,它生成一个阿姨,你要求一只猫坐飞机,它会让一只猫出现在飞机顶部。

这都是由于认识不够造成的。

其次是视频生成效果,比如画面流畅度、人物稳定性、动作连贯性、光影一致性、风格准确度等。

以前很多生成的视频都存在屏幕抖动、闪烁、变形、掉帧等问题。

如今技术进步了,但字符的稳定性和一致性仍需提高。

另外,如果画面主体动作幅度较大,也容易“暴露”。

比如,转身的女孩可能有鹅蛋脸、大饼脸,或者奔跑的马甩出“无影腿”。

另一点是产品的易用性。

AI生成视频*的革命之一是它显着降低了使用门槛。

只需输入少量信息即可实现丰富的效果。

过去,视频工作者使用PR、AE制作视频,必须点击各种复杂的操作界面。

按钮来调整大量参数,现在您只需键入即可。

产品是否易用是技术能否大规模普及的重要前提。

AI图像放大最近被人们“玩坏了”,也是因为操作简单,但效果感人。

当普通新手能够发布视频和照片时,那么爆款产品的诞生就离我们不远了。

目前来看,上述三个指标都取得了长足的进步,尤其是刚刚推出的皮卡1.0,各方面表现均衡。

然而,输出不稳定仍然是一个普遍问题。

视频长度也是一个很大的限制。

目前主流的文胜视频产品,正常生成的视频长度一般为3~4秒,最长不超过30秒。

生成视频的时间越长,对AI的理解和生成能力的要求就越高,泄密的概率就越大。

因此,很多人不得不采用“笔芯”的方法,将其与其他材料结合起来,才能达到理想的效果。

在两个预告片《芭比海默》《Trailer:Genesis》中,作者使用了Midjourney(图像处理)、Gen-2(视频处理)、CapCut(视频编辑)等多种工具。

吴洁谦表示,AI文胜视频产品目前市面上最多只能生成十几秒的视频。

瀚浩科技即将推出的产品将尝试生成任意长度的短视频,比如15秒短视频、1分钟左右。

戏剧性,这也可以成为一个差异化特征。

所以目前来说,依靠AI直接生成一整部大片还为时过早。

3.争夺AIGC的最后一块拼图。

在AIGC的各大细分领域中,AI文胜视频被认为是最后一块拼图,也是多模态AI创作的“圣杯”。

整个行业的热潮逐渐从文胜文、文胜图片转移到文胜视频领域。

Runway是一家成立于2001年的美国公司,曾引领AI生成视频的浪潮。

Gen-1于今年2月推出,专注于将视频转换为视频,并且可以改变视频风格; Gen-2于三月份推出,可以使用文本、图像或视频剪辑生成新视频。

Gen-2将生成视频的最大长度从4秒增加到18秒,并且还可以控制“镜头”并使用“运动画笔”随意指挥移动。

它曾经是Vincentian视频领域最先进的模型。

Runway的创始团队拥有深厚的电影、电视、艺术背景,因此其客户主要是电影级的视频剪辑师和制作人,他们的技术已经应用于好莱坞大片《瞬息全宇宙》。

下半年,Runway完成超1亿美元融资,公司估值超15亿美元。

最新的玩家是皮卡。

该公司由两位中国女博士创立。

在美国辍学的学生。

公司成立仅8个月,现有员工4人。

皮卡进步很快。

文森特新视频工具Pika 1.0于11月底发布,迅速在各大社交媒体上流行起来。

再加上创始人女主爽文的人物设计,被国内媒体疯狂报道。

一位AI创业者告诉《鼎教》,皮卡采取了差异化的方式,专注于动画生成,避免了AI生成视频在保真度和真实性方面的缺点。

另外,在Pika正式推出1.0版本之前,已经在discord中积累了一定数量的用户。

除了这两家公司之外,AI视频领域的玩家还包括Stability AI。

其最著名的产品是 Vincent 图片应用程序 Stable Diffusion。

11月,刚刚发布了自己的*Vincent视频模型Stable Video Diffusion; Meta 发布 Make-A- Video;谷歌推出了 Imagen Video 和 Phenaki。

中信建设投资走势图 国内进展较为缓慢,尚未出现明星产品。

已经推出或正在开发文胜视频应用的公司包括右脑科技、胜数科技、万兴科技、美图等。

其中,右脑科技的视频功能将于8月开放内测应用。

这是一家年轻的公司,今年9月才成立,已经获得了奇绩创坛、光速光合作用的投资。

圣数科技今年3月才成立,由RealAI、蚂蚁金服和百度创投共同孵化。

也有一些企业善于挖掘热点,无论是主动还是被动。

在皮卡被媒体炒作的日子里,A股上市公司新雅达股价暴涨,连续六个交易日逼近涨停,累计涨幅接近一倍。

这仅仅是因为皮卡创始人郭文静是新雅达实际控制人郭华强的女儿。

两家公司没有业务往来,新雅达也没有AI视频生成相关的产品和业务。

炒概念一直是资本市场的通病。

该集团今年6月发布大型模型产品时,还展示了文森视频功能,声称是“国内唯一实现文森视频功能的大型模型产品”和“最先进的之一”世界人工智能技术。

”当然,我们不知道有多少人会相信这些自称的标题,也不知道有多少人会使用这些产品。

在图片领域具有优势的美图公司也在皮卡推出一周内发布了MiracleVision 4.0版本的大比例视觉模型。

主要功能是AI视频。

不过这些功能目前还没有推出,未来几年将逐步应用到美图秀秀等产品中。

AI行业太吵闹了,我们常常分不清哪些公司是在做产品,哪些公司是来炒股的。

抛开这些杂音,AI文胜视频技术本身就不错,有望推动生产力革命,加速AIGC技术的产业化。

中信证券认为,文森视频有望在短视频和动画两个领域率先落地,短视频制作中的传统实拍模式有望被生成技术取代。

也许用不了多久,短视频就不再需要真人出现、拍摄和录制。

这不仅仅意味着口头场景,而是任何你能想象到的场景,以及很多你无法想象的图像。

AI 生成的视频:有点惊人,有点令人震惊

随后,AI生成的视频大规模入侵互联网,AI像流水线一样批量生产短视频。

短视频的游戏规则也将改变。

【本文经投资界合作伙伴微信公众号授权:顶角一号。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

AI 生成的视频:有点惊人,有点令人震惊

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • “风驰计划”再次升级!阿里云优惠券申请零!零!零!门槛

    “风驰计划”再次升级!阿里云优惠券申请零!零!零!门槛

    “风池计划”升级前后详解 1、全面开放申请。 以往,只有隶属于阿里巴巴创新中心合作伙伴的企业才能申请“风池计划”,比如入驻阿里巴巴创新中心城市孵化基地的企业。 升级版“风驰计划”全面开放申请。 扫描二维码登录,一键完成。 2.增加申请额度。 此前的“风池计划”仅分

    06-18

  • 精品咖啡被9元逼到墙角

    精品咖啡被9元逼到墙角

    近日,中国本土精品咖啡品牌Seesaw多地关店的消息引发广泛关注。 据媒体和网友不完全统计,今年下半年以来Seesaw在上海、北京、武汉、重庆等地开设的部分门店已停止营业。 食品饮料行业自媒体《食品内参》也从门店社区的角度对Seesaw的关店情况进行了梳理。 长期以来,Seesa

    06-18

  • PlayAI 是一家 Web3 人工智能和游戏公司,筹集了 430 万美元的种子资金,

    PlayAI 是一家 Web3 人工智能和游戏公司,筹集了 430 万美元的种子资金,

    PlayAI 是一家 Web3 人工智能和游戏公司,最近退出了隐身模式,并宣布获得 10,000 美元种子轮融资,使公司估值达到 10,000 美元。 本轮融资得到了 P2 Ventures、Jump Crypto 等知名投资者的支持。 该公司的平台鼓励玩家分享他们的游戏数据,然后将这些数据用于训练人工智能模

    06-18

  • Web 3.0,一个危险的社会实验-甲子光年

    Web 3.0,一个危险的社会实验-甲子光年

    一个集合了区块链、比特币、NFT、元宇宙的统一系统。 作者 |编辑艾米丽 |赵健 你知道Constitution DAO是什么吗?您听说过 Axie Infinity 和 ChainRoblox 吗?也许你对这些英文单词还比较陌生,但在不久的将来Web 3.0肯定会是你经常看到的一个词。 事实上,前述的几种都是Web

    06-18

  • 食品公司万洲国际计划IPO集资53亿美元

    食品公司万洲国际计划IPO集资53亿美元

    据香港经济日报报道,中国猪肉食品公司万洲国际(8-HK)计划上市,集资最多1亿港元(53亿美元) 。 这将是一家大型食品公司,也是饮料行业历史上第二大IPO。 该公司将于今日开始路演,预计22日对产品定价,30日上市。   据《路透》取得的销售文件显示,万洲国际设定的发行价

    06-18

  • 摩凯茂凯获金宝贝战略投资,打造一站式早教服务平台

    摩凯茂凯获金宝贝战略投资,打造一站式早教服务平台

    据投资界消息,10月16日,国内托育服务领先品牌摩凯茂凯举办“金未来-摩凯新融合”茂凯融资暨新战略发布会正式宣布获得全球领先早教品牌金宝贝超亿元战略投资,拓展金宝贝全球早教服务版图,助力摩关怀牵头打造托育3.0提供托育、亲子、家庭早期教育融合发展的模式。 创造新标

    06-17

  • 澳大利亚提维群岛将建成 2.8 吉瓦太阳能绿氢综合设施

    澳大利亚提维群岛将建成 2.8 吉瓦太阳能绿氢综合设施

    澳大利亚能源转型公司 Global Energy Ventures 上周公布了在澳大利亚北领地附近提维岛建设 2.8 吉瓦太阳能绿氢综合设施的计划。 兆瓦太阳能发电厂为现场绿色氢中心的生产提供燃料。 所谓的提维氢项目(TWP)将启动兆瓦级太阳能光伏(PV)园区的建设,并将逐步扩大到兆瓦级。

    06-08

  • 瓦盛科技完成亿元B轮融资,金浦投资独家领投

    瓦盛科技完成亿元B轮融资,金浦投资独家领投

    投资界(ID:pedaily)消息,近日,远程会议智能设备提供商“瓦盛科技”宣布完成100 -百万元B轮融资,由金浦投资独家领投,远望资本、纪源资本、昊辰资本等老股东全程参与,万石资本作为独家投资方。 本轮融资将主要用于产品研发和迭代,推出更多差异化的软硬件产品和智能会议

    06-18

  • 十大IC设计厂商Q2营收同比增长60.8%,下半年增速放缓

    十大IC设计厂商Q2营收同比增长60.8%,下半年增速放缓

    市场研究机构TrendForce周三(15日)发布最新统计数据)显示,今年第二季度,全球十大IC设计厂商总营收达亿元,同比增长60.8%。 但终端市场需求逐渐回升,预计下半年增速有限。 具体来看第二季度营收表现,高通仍以64.7亿美元位列十大厂商第一,同比增长70%,主要受益于处理器

    06-08

  • AIoT(AI of Things)领域初创公司Addx.ai完成数千万元天使轮融资,由线性资本领投,华创等跟投

    AIoT(AI of Things)领域初创公司Addx.ai完成数千万元天使轮融资,由线性资本领投,华创等跟投

    投资界动态5月21日宣布完成数千万元天使轮融资。 本轮融资由线性资本领投,华创资本、智友金苗、IMO等天使投资人跟投,其中包括两位科学顾问天使投资人、北航机器人专家王田苗教授、深鉴科技创始人、清华大学汪玉教授。 本轮融资将主要用于团队建设、产品开发等。 Addx.ai成立

    06-18

  • 特种机器人公司“启腾科技”完成数千万元融资

    特种机器人公司“启腾科技”完成数千万元融资

    据投资界3月16日消息,特种机器人公司“启腾科技”完成数千万元融资。 红马资本与三一重工共同投资。 本轮融资将用于加大研发投入、扩大产能、拓展新业务。 重庆启腾科技有限公司是一家从事特种机器人产品和智能仓储产品研发和销售的高新技术企业。 其产品主要为危化工厂消防

    06-18

  • 早上好,大年初二祝福

    早上好,大年初二祝福

    星云创业扶持计划提供产品技术支持、园区政策支持、品牌支持、融资支持、商机推荐支持等帮助中小企业大的创业公司不断成长并取得成功,所以天下没有难事。

    06-17