河北省20亿机器人产业基金招募GP
06-17
在当前的AI赛道上,AI聊天、AI绘画等应用已经百花齐放。
然而,在这种同质化应用的背景下,一类技术难度较大且很少被提及的方向正在悄然兴起。
这是最能唤起人们感官的视频AI领域。
根据Twitter作者Will Lang Hanwei整理的图表,今年8月至9月,各大文胜图形AI网站的访问量开始呈现下降趋势。
然而在此情况下,国外知名视频AI网站HeyGen的访问量增长了92%,其流量在各大独立AI网站中排名第一。
那么,为何之前默默无闻的视频AI,最近突然异军突起,盖过了当下流行的基于图像的AI应用呢? 而随着GPT-4V的发布以及多模态技术的不断突破,这种微妙的变化意味着什么? 01 多模态的序幕 从AI发展的整体来看,HeyGen的流量增长或许只是多模态快速发展背景下的一个插曲。
从谷歌宣布Gemini具备多模态能力,到OpenAI发布GPT-4V,各路AI巨头似乎都将下一阶段的竞争重点放在了多模态上。
那么多模态为何成为巨头眼中的关键“突破点”呢? 原因或许在于它具有打破“职业壁垒”的意义。
在多式联运取得突破之前,不同模式和领域之间存在巨大差距。
文案、编辑无论多么才华横溢,如果缺乏相应的美术知识和各种专业提示,也无法利用人工智能绘制出优秀的作品。
而如果一个画家没有接受过专业的写作训练,缺乏文章排版的思路,他就很难用AI写出好文章。
类似的“障碍”在视频编辑中也存在。
据知乎上一位视频剪辑从业者介绍,一个完整的视频剪辑流程包括调色、整理素材、字幕等一系列工作。
想要熟练剪辑,必须熟练掌握PR、Edius、编辑等,还需要熟悉各种转场、调色、粒子*等插件的使用。
如果想让视频有更丰富的效果,还需要掌握b-roll转场、字幕遮蔽、坡度变化等复杂的操作。
此外,素材的收集和整理也是剪辑的一大“辛苦活”。
如果题材比较冷门,那就很难找到素材。
有时即使你找到了好的素材,也可能因为版权问题而难以使用。
正是由于上述原因,视频编辑注定不是一项简单且易于掌握的技能。
以国内知名网站哔哩哔哩为例。
据哔哩哔哩一位拥有数百万粉丝的UP主团队介绍,为了保证视频更新的效率和质量,这些账号往往会配备数名技术较熟练的剪辑师轮流剪辑。
那么,如果有一款智能AI剪辑应用,能够按照创作者想要表达的想法,自动高效地完成整个视频制作,那么视频制作领域将会发生怎样的颠覆呢? 事实上,这样的技术已经出现了。
下面的两张图片来自两个不同的视频片段。
你能分辨出哪一张是真实的,哪一张是人工智能生成的吗? 答案是:这两个视频都是AI生成的人像视频。
而且它们都是由前面提到的HeyGen 生产的。
在HeyGen上,用户只需要上传一段2分钟的短视频,就可以达到与真人一样的效果。
甚至连手势、脸型和嘴型等“微妙的肢体语言”都可以调整。
这种效果的实现,是目前多模态技术发展的开始。
02 视频AI的力量 如果我们要谈HeyGen与其他类似视频AI应用*的区别,那就是它可以利用现有数据创建新的、前所未见的内容。
过去类似的应用,例如D-ID,也允许用户从照片或AI图像生成视频,但此类技术更多是基于复制或处理现有内容的AI技术。
虽然这些技术也可以制作视频,但它们需要用户提供自己的照片或录音,或者从 D-ID 提供的一些固定的 AI 图像中进行选择。
这需要用户花费更多的时间和精力准备和上传素材,也限制了用户的选择和定制空间。
相比之下,HeyGen 的技术允许用户直接从文本生成视频,并使用各种不同的 AI 图像和语音。
除了HeyGen之外,在视频AI领域,许多势头强劲的类似应用也正在悄然兴起。
例如,可以直接将脚本转换为视频的Pictory.AI就是其中之一。
Pictory 允许用户将脚本转换为具有逼真 AI 语音的专业品质视频,只需点击几下即可匹配素材和音乐。
具体来说,用户在制作视频时,可以选择Pictory提供的各种模板中的一种来设置视频的风格。
之后,Pictory 会根据用户输入的文本以及所选的模板和比例自动生成故事板。
故事板是由多个场景组成的视频序列。
每个场景都包含文字、图片、AI语音和一段音乐。
最后,用户可以在故事板上预览视频的效果并进行一些编辑和调整。
这样,团队就可以制作专业、高质量的视频,而无需昂贵的摄影师和剪辑师。
同样,用3D CGI角色代替真实演员的Wonder Studio也是旨在提高视频制作效率的AI应用之一。
Wonder Studio是一个基于网络的视频平台,允许用户轻松地将任何计算机生成的角色(CGI角色)添加到任何场景,利用AI技术实现无缝集成。
用户只需拍摄自己想要的场景并将其上传到网站即可。
Wonder Studio的AI引擎会自动分析场景中演员的表现,包括他们的动作和面部表情,并将这些信息转换成动作数据,然后使用这些数据来驱动用户选择的CGI角色。
通过这种方式,用户可以完全用 3D CGI 角色代替真实演员,而无需使用复杂的 3D 软件或昂贵的制作设备,例如动作捕捉套装。
03 趋势及国内现状 从以上视频AI的技术特点,我们至少可以总结出当前视频AI技术的两大趋势: 1、制作流程大幅简化。
利用生成式人工智能技术,人们可以以自动化、智能化的方式使用生成式人工智能技术。
,重新组合文本、图像、音频和视频等多模态数据,创建前所未有的新内容。
在降低成本的同时,也打破了各种业态(或专业)之间的“技术壁垒”。
”。
打破这一壁垒是生成式人工智能泛化和普及的关键。
2.内容的多样性和定制化。
利用多模态人工智能技术,人们可以处理和关联多种信息模态,从而更好地表达自己的个性和个性。
内容创作过程中的风格,以及适应不同场合和目的,这在过去局限于现有素材的单一模态技术中很难实现。
虽然目前国内也有一些类似HeyGen的AI视频应用,比如腾讯智影、一帧秒、万彩微影等,但这些应用也只是利用AI技术来简化视频创作。
处理并提供文字配音、文章转视频、数字真人直播等功能。
但就具体生成效果而言,国内应用在视频清晰度、素材丰富度、定制化功能等方面与HeyGen等应用仍有较大差距。

总体而言,此类应用仍然只能在平台提供的素材库内选择有限的元素进行创作,并且在某些类别(例如数字真人视频)上,国内应用生成的视频还没有达到HeyGen视频的水平。
如此流畅、现实的标准。
如果说,在这一轮AI革命中,国内视频AI技术仅仅停留在“降本”阶段,长远来看,还远远不足以征服智能时代的观众。
从目前观众的态度来看,AI制作的视频仍处于“不受欢迎”的状态。
许多观众仍然认为在视频中使用人工智能技术是一种懒惰、不负责任和廉价的制作方式。
。
原因在于,目前国内的一些人工智能技术还没有突破感官门槛,人们仍然清晰地感觉到“这不是人类做的”。
从而给人一种“没有感情”、“粗制滥造”的印象。
更重要的是,使用AI技术的视频甚至被贴上“营销号”的标签。
面对这样的环境,任何一个爱惜自己羽毛的视频创作者都不敢轻易使用AI技术,生怕被视为“营销号”,被贴上“粗制滥造”的标签。
生成式AI的进步确实大大简化了视频制作流程,但在已经到来的智能时代,观众不再希望看到那些批量、流水线的“劣质”视频。
要想摆脱这样的“劣质”标签,真正让作品有情感、有灵魂,除了不断“降低成本”之外,在个性化、逼真度、素材丰富度等方面,国内视频AI还有很长的路要走去。
【本文由投资界合作伙伴微信公众号授权:AI新智能。
本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-21
06-21
06-18
最新文章
三只松鼠:门店扩张已全面暂停
Nvidia 已准备好“统治”AI
【创业24小时】2023年11月16日
【创业24小时】2022年10月20日
倒计时一天,浙江这座小镇要火了!
沃图网络获数千万A轮投资,加大投入海外网红营销SaaS平台建设
泰山天使基金部分退出拉手半年回报180倍
西格数据完成1000万元A+轮融资,国发创投领投