首页 > 科技动态 > 内容

视频AI的突然崛起揭示了什么？

发布于：2024-06-17 编辑：匿名来源：网络

在当前的AI赛道上，AI聊天、AI绘画等应用已经百花齐放。

然而，在这种同质化应用的背景下，一类技术难度较大且很少被提及的方向正在悄然兴起。

这是最能唤起人们感官的视频AI领域。

根据Twitter作者Will Lang Hanwei整理的图表，今年8月至9月，各大文胜图形AI网站的访问量开始呈现下降趋势。

然而在此情况下，国外知名视频AI网站HeyGen的访问量增长了92%，其流量在各大独立AI网站中排名第一。

那么，为何之前默默无闻的视频AI，最近突然异军突起，盖过了当下流行的基于图像的AI应用呢？而随着GPT-4V的发布以及多模态技术的不断突破，这种微妙的变化意味着什么？ 01 多模态的序幕从AI发展的整体来看，HeyGen的流量增长或许只是多模态快速发展背景下的一个插曲。

从谷歌宣布Gemini具备多模态能力，到OpenAI发布GPT-4V，各路AI巨头似乎都将下一阶段的竞争重点放在了多模态上。

那么多模态为何成为巨头眼中的关键“突破点”呢？原因或许在于它具有打破“职业壁垒”的意义。

在多式联运取得突破之前，不同模式和领域之间存在巨大差距。

文案、编辑无论多么才华横溢，如果缺乏相应的美术知识和各种专业提示，也无法利用人工智能绘制出优秀的作品。

而如果一个画家没有接受过专业的写作训练，缺乏文章排版的思路，他就很难用AI写出好文章。

类似的“障碍”在视频编辑中也存在。

据知乎上一位视频剪辑从业者介绍，一个完整的视频剪辑流程包括调色、整理素材、字幕等一系列工作。

想要熟练剪辑，必须熟练掌握PR、Edius、编辑等，还需要熟悉各种转场、调色、粒子*等插件的使用。

如果想让视频有更丰富的效果，还需要掌握b-roll转场、字幕遮蔽、坡度变化等复杂的操作。

此外，素材的收集和整理也是剪辑的一大“辛苦活”。

如果题材比较冷门，那就很难找到素材。

有时即使你找到了好的素材，也可能因为版权问题而难以使用。

正是由于上述原因，视频编辑注定不是一项简单且易于掌握的技能。

以国内知名网站哔哩哔哩为例。

据哔哩哔哩一位拥有数百万粉丝的UP主团队介绍，为了保证视频更新的效率和质量，这些账号往往会配备数名技术较熟练的剪辑师轮流剪辑。

那么，如果有一款智能AI剪辑应用，能够按照创作者想要表达的想法，自动高效地完成整个视频制作，那么视频制作领域将会发生怎样的颠覆呢？事实上，这样的技术已经出现了。

下面的两张图片来自两个不同的视频片段。

你能分辨出哪一张是真实的，哪一张是人工智能生成的吗？答案是：这两个视频都是AI生成的人像视频。

而且它们都是由前面提到的HeyGen 生产的。

在HeyGen上，用户只需要上传一段2分钟的短视频，就可以达到与真人一样的效果。

甚至连手势、脸型和嘴型等“微妙的肢体语言”都可以调整。

这种效果的实现，是目前多模态技术发展的开始。

02 视频AI的力量如果我们要谈HeyGen与其他类似视频AI应用*的区别，那就是它可以利用现有数据创建新的、前所未见的内容。

过去类似的应用，例如D-ID，也允许用户从照片或AI图像生成视频，但此类技术更多是基于复制或处理现有内容的AI技术。

虽然这些技术也可以制作视频，但它们需要用户提供自己的照片或录音，或者从 D-ID 提供的一些固定的 AI 图像中进行选择。

这需要用户花费更多的时间和精力准备和上传素材，也限制了用户的选择和定制空间。

相比之下，HeyGen 的技术允许用户直接从文本生成视频，并使用各种不同的 AI 图像和语音。

除了HeyGen之外，在视频AI领域，许多势头强劲的类似应用也正在悄然兴起。

例如，可以直接将脚本转换为视频的Pictory.AI就是其中之一。

Pictory 允许用户将脚本转换为具有逼真 AI 语音的专业品质视频，只需点击几下即可匹配素材和音乐。

具体来说，用户在制作视频时，可以选择Pictory提供的各种模板中的一种来设置视频的风格。

之后，Pictory 会根据用户输入的文本以及所选的模板和比例自动生成故事板。

故事板是由多个场景组成的视频序列。

每个场景都包含文字、图片、AI语音和一段音乐。

最后，用户可以在故事板上预览视频的效果并进行一些编辑和调整。

这样，团队就可以制作专业、高质量的视频，而无需昂贵的摄影师和剪辑师。

同样，用3D CGI角色代替真实演员的Wonder Studio也是旨在提高视频制作效率的AI应用之一。

Wonder Studio是一个基于网络的视频平台，允许用户轻松地将任何计算机生成的角色（CGI角色）添加到任何场景，利用AI技术实现无缝集成。

用户只需拍摄自己想要的场景并将其上传到网站即可。

Wonder Studio的AI引擎会自动分析场景中演员的表现，包括他们的动作和面部表情，并将这些信息转换成动作数据，然后使用这些数据来驱动用户选择的CGI角色。

通过这种方式，用户可以完全用 3D CGI 角色代替真实演员，而无需使用复杂的 3D 软件或昂贵的制作设备，例如动作捕捉套装。

03 趋势及国内现状从以上视频AI的技术特点，我们至少可以总结出当前视频AI技术的两大趋势： 1、制作流程大幅简化。

利用生成式人工智能技术，人们可以以自动化、智能化的方式使用生成式人工智能技术。

，重新组合文本、图像、音频和视频等多模态数据，创建前所未有的新内容。

在降低成本的同时，也打破了各种业态（或专业）之间的“技术壁垒”。

”。

打破这一壁垒是生成式人工智能泛化和普及的关键。

2.内容的多样性和定制化。

利用多模态人工智能技术，人们可以处理和关联多种信息模态，从而更好地表达自己的个性和个性。

内容创作过程中的风格，以及适应不同场合和目的，这在过去局限于现有素材的单一模态技术中很难实现。

虽然目前国内也有一些类似HeyGen的AI视频应用，比如腾讯智影、一帧秒、万彩微影等，但这些应用也只是利用AI技术来简化视频创作。

处理并提供文字配音、文章转视频、数字真人直播等功能。

但就具体生成效果而言，国内应用在视频清晰度、素材丰富度、定制化功能等方面与HeyGen等应用仍有较大差距。

视频AI的突然崛起揭示了什么？

总体而言，此类应用仍然只能在平台提供的素材库内选择有限的元素进行创作，并且在某些类别（例如数字真人视频）上，国内应用生成的视频还没有达到HeyGen视频的水平。

如此流畅、现实的标准。

如果说，在这一轮AI革命中，国内视频AI技术仅仅停留在“降本”阶段，长远来看，还远远不足以征服智能时代的观众。

从目前观众的态度来看，AI制作的视频仍处于“不受欢迎”的状态。

许多观众仍然认为在视频中使用人工智能技术是一种懒惰、不负责任和廉价的制作方式。

。

原因在于，目前国内的一些人工智能技术还没有突破感官门槛，人们仍然清晰地感觉到“这不是人类做的”。

从而给人一种“没有感情”、“粗制滥造”的印象。

更重要的是，使用AI技术的视频甚至被贴上“营销号”的标签。

面对这样的环境，任何一个爱惜自己羽毛的视频创作者都不敢轻易使用AI技术，生怕被视为“营销号”，被贴上“粗制滥造”的标签。

生成式AI的进步确实大大简化了视频制作流程，但在已经到来的智能时代，观众不再希望看到那些批量、流水线的“劣质”视频。

要想摆脱这样的“劣质”标签，真正让作品有情感、有灵魂，除了不断“降低成本”之外，在个性化、逼真度、素材丰富度等方面，国内视频AI还有很长的路要走去。

【本文由投资界合作伙伴微信公众号授权：AI新智能。

本平台仅提供信息存储服务。

】如有任何疑问，请联系投资界（）。

站长声明

标签：

上一篇：连中产阶级都买不起国产香水

下一篇：母婴服务大数据平台菩提果获百万投资，与紫金堂达成战略合作

进入二次元，获得COS图文社区半个维度，今日头条的边界在哪里？

今日头条的内容野心越来越明显。　　据投资界2月7日消息，今日头条近日成功收购cosplay手绘社区“半次元”。具体金额尚未确认。据36氪了解，半维主公司杭州网耀网络近日更新了工商信息，法人变更为今日头条旗下北京闪星网络。　　半次元定位为“国内首家COS图文小说社区

06-18
Soitec发布2020财年第三季度业绩报告，同比增长16%

北京，2020年2月7日 - 作为全球创新半导体材料设计和生产的领导者，法国Soitec半导体公司于1月21日公布了截至12月31日的财年第三季度业绩。与财年同期的1亿欧元相比，业绩增长了15.9%。在固定汇率和边界1下，这一增长归因于销售额增长11.3%、汇率升值带来4.1%的积极影响，以

06-06
农民工把景德镇购物变成线下拼多多？ “回来就迫不及待地想把手镯戴满全身”

景德镇，在这里可以近距离看到网红“沉默的菩萨”，还能买到批发手镯和漂亮的小陶瓷，也是很不错的受欢迎的。毕竟现在流行去批发店购物，消除了中间商赚差价的可能性。景德镇作为大型陶瓷生产基地，自然越来越受到人们的喜爱。我有点好奇，这个“能买货”的新网红旅游城市

06-18
远景与红杉中国合作设立100亿碳中和基金

投资界（ID：pedaily）3月29日消息，远景科技集团与红杉中国宣布将共同设立总规模碳中和基金1亿元。和科技基金，投资和培育全球碳中和领域的领先科技企业，构建零碳新产业体系。该基金也是国内首支由绿色科技企业与风险投资机构共同设立的百亿规模碳中和科技基金。将积极与

06-17
利用SCRM系统优化WhatsApp海外营销策略

.wp-block-column h3{margin-left:0} 全球化时代，海外营销已成为企业拓展国际市场的重要途径之一。作为全球最受欢迎的即时通讯应用之一，WhatsApp已成为企业与海外客户联系的重要渠道。伟峰海外SCRM系统通过智能数据管理和多渠道整合，为企业优化WhatsApp海外营销策略提供

06-18
跨境海外营销：海外客服机器人的应用

.wp-block-column h3{margin-left:0} 文章摘要：跨境海外营销需要面对来自不同国家和地区的用户，以及语言障碍已成为一个重要的问题。海外客服机器人可以通过语音识别和自然语言处理技术提供多语言支持，帮助企业与海外用户无障碍沟通。

06-18
从教育品牌特许经营市场入手，乂渠完成1300万元Pre-A轮融资

据投资界8月9日消息，特许经营服务商乂渠近日完成1300万元Pre-A轮融资1万元。投资方是一学教育创业黑马。　　乂渠进军教育品牌特许经营市场，为企业主提供全流程定制化特许经营服务。从项目包装、PPT制作、预算分割、客服培训、加盟准备期的市场调研，到组织架构设计、渠道

06-18
GPT-4更强的标志其实就藏在标志里了

怎么一眼就能看出20美元的GPT-4比免费的GPT-3.5更强呢？ OpenAI的答案是比较标志。前者是星星，后者是闪电。乍一看你可能会一头雾水，但事实上，从 2002 年开始，GPT-4 旁边闪亮的“四角星”就成为了全球先进 AI 产品的狂野代名词。全世界的AI都在为你闪烁。过去一年来，

06-21
宜宾，动力电池蓬勃发展

投资界创投情报局城市招牌，我们来到了四川东南部城市宜宾。四千年来，酒香浸透容城。宜宾有着多年的酿酒历史，被誉为“长江之都、中国酒都”。这也是给外界留下最深刻的印象之一。据宜宾市统计局统计，宜宾全年GDP达8400万元，位居四川省第三位。但令人惊讶的是，这里正

06-18
首次发布 -泰岳耀明资本完成新一期1.375亿元人民币基金

投资界（ID：pedaily）6月11日消息，泰岳耀明资本今日宣布已成功完成1.375亿元人民币早期基金——北京泰岳耀明资本明创投中心（有限合伙）募集资金并完成首期交割。该基金将重点投资处于天使阶段和初创阶段的公司。本次募资完成后，泰岳耀明资本将继续重点支持早期科技企业

06-17
惠州首支百亿产业投资基金来了

投资圈（ID：pedaily）10月14日消息：为加快市属国有企业高质量发展，惠州市将启动新一轮年底市属国企改革重组。 2019年8月25日，惠州市国有资本投资集团有限公司（以下简称“惠州国投”）在整合市属上市公司股权、准上市公司等核心资源的基础上正式成立。金融资产等优质企业

06-18
为了租房，我下载了近10个应用程序

又到了毕业季，也是租房季。李琳和室友在北京，即将毕业离校，他们用手机下载了《自如》、《蛋壳公寓》、《爱上租房》、《链家》、《安居客》、《豆瓣》、《北客找黄》、《我爱我家》等。近 10 个找房应用程序。浏览了无数租房信息后，两人被安居客上的一则房源吸引：主卧

06-17