首页 > 科技动态 > 内容

视频AI的突然崛起揭示了什么?

发布于:2024-06-17 编辑:匿名 来源:网络

在当前的AI赛道上,AI聊天、AI绘画等应用已经百花齐放。

然而,在这种同质化应用的背景下,一类技术难度较大且很少被提及的方向正在悄然兴起。

这是最能唤起人们感官的视频AI领域。

根据Twitter作者Will Lang Hanwei整理的图表,今年8月至9月,各大文胜图形AI网站的访问量开始呈现下降趋势。

然而在此情况下,国外知名视频AI网站HeyGen的访问量增长了92%,其流量在各大独立AI网站中排名第一。

那么,为何之前默默无闻的视频AI,最近突然异军突起,盖过了当下流行的基于图像的AI应用呢? 而随着GPT-4V的发布以及多模态技术的不断突破,这种微妙的变化意味着什么? 01 多模态的序幕 从AI发展的整体来看,HeyGen的流量增长或许只是多模态快速发展背景下的一个插曲。

从谷歌宣布Gemini具备多模态能力,到OpenAI发布GPT-4V,各路AI巨头似乎都将下一阶段的竞争重点放在了多模态上。

那么多模态为何成为巨头眼中的关键“突破点”呢? 原因或许在于它具有打破“职业壁垒”的意义。

在多式联运取得突破之前,不同模式和领域之间存在巨大差距。

文案、编辑无论多么才华横溢,如果缺乏相应的美术知识和各种专业提示,也无法利用人工智能绘制出优秀的作品。

而如果一个画家没有接受过专业的写作训练,缺乏文章排版的思路,他就很难用AI写出好文章。

类似的“障碍”在视频编辑中也存在。

据知乎上一位视频剪辑从业者介绍,一个完整的视频剪辑流程包括调色、整理素材、字幕等一系列工作。

想要熟练剪辑,必须熟练掌握PR、Edius、编辑等,还需要熟悉各种转场、调色、粒子*等插件的使用。

如果想让视频有更丰富的效果,还需要掌握b-roll转场、字幕遮蔽、坡度变化等复杂的操作。

此外,素材的收集和整理也是剪辑的一大“辛苦活”。

如果题材比较冷门,那就很难找到素材。

有时即使你找到了好的素材,也可能因为版权问题而难以使用。

正是由于上述原因,视频编辑注定不是一项简单且易于掌握的技能。

以国内知名网站哔哩哔哩为例。

据哔哩哔哩一位拥有数百万粉丝的UP主团队介绍,为了保证视频更新的效率和质量,这些账号往往会配备数名技术较熟练的剪辑师轮流剪辑。

那么,如果有一款智能AI剪辑应用,能够按照创作者想要表达的想法,自动高效地完成整个视频制作,那么视频制作领域将会发生怎样的颠覆呢? 事实上,这样的技术已经出现了。

下面的两张图片来自两个不同的视频片段。

你能分辨出哪一张是真实的,哪一张是人工智能生成的吗? 答案是:这两个视频都是AI生成的人像视频。

而且它们都是由前面提到的HeyGen 生产的。

在HeyGen上,用户只需要上传一段2分钟的短视频,就可以达到与真人一样的效果。

甚至连手势、脸型和嘴型等“微妙的肢体语言”都可以调整。

这种效果的实现,是目前多模态技术发展的开始。

02 视频AI的力量 如果我们要谈HeyGen与其他类似视频AI应用*的区别,那就是它可以利用现有数据创建新的、前所未见的内容。

过去类似的应用,例如D-ID,也允许用户从照片或AI图像生成视频,但此类技术更多是基于复制或处理现有内容的AI技术。

虽然这些技术也可以制作视频,但它们需要用户提供自己的照片或录音,或者从 D-ID 提供的一些固定的 AI 图像中进行选择。

这需要用户花费更多的时间和精力准备和上传素材,也限制了用户的选择和定制空间。

相比之下,HeyGen 的技术允许用户直接从文本生成视频,并使用各种不同的 AI 图像和语音。

除了HeyGen之外,在视频AI领域,许多势头强劲的类似应用也正在悄然兴起。

例如,可以直接将脚本转换为视频的Pictory.AI就是其中之一。

Pictory 允许用户将脚本转换为具有逼真 AI 语音的专业品质视频,只需点击几下即可匹配素材和音乐。

具体来说,用户在制作视频时,可以选择Pictory提供的各种模板中的一种来设置视频的风格。

之后,Pictory 会根据用户输入的文本以及所选的模板和比例自动生成故事板。

故事板是由多个场景组成的视频序列。

每个场景都包含文字、图片、AI语音和一段音乐。

最后,用户可以在故事板上预览视频的效果并进行一些编辑和调整。

这样,团队就可以制作专业、高质量的视频,而无需昂贵的摄影师和剪辑师。

同样,用3D CGI角色代替真实演员的Wonder Studio也是旨在提高视频制作效率的AI应用之一。

Wonder Studio是一个基于网络的视频平台,允许用户轻松地将任何计算机生成的角色(CGI角色)添加到任何场景,利用AI技术实现无缝集成。

用户只需拍摄自己想要的场景并将其上传到网站即可。

Wonder Studio的AI引擎会自动分析场景中演员的表现,包括他们的动作和面部表情,并将这些信息转换成动作数据,然后使用这些数据来驱动用户选择的CGI角色。

通过这种方式,用户可以完全用 3D CGI 角色代替真实演员,而无需使用复杂的 3D 软件或昂贵的制作设备,例如动作捕捉套装。

03 趋势及国内现状 从以上视频AI的技术特点,我们至少可以总结出当前视频AI技术的两大趋势: 1、制作流程大幅简化。

利用生成式人工智能技术,人们可以以自动化、智能化的方式使用生成式人工智能技术。

,重新组合文本、图像、音频和视频等多模态数据,创建前所未有的新内容。

在降低成本的同时,也打破了各种业态(或专业)之间的“技术壁垒”。

”。

打破这一壁垒是生成式人工智能泛化和普及的关键。

2.内容的多样性和定制化。

利用多模态人工智能技术,人们可以处理和关联多种信息模态,从而更好地表达自己的个性和个性。

内容创作过程中的风格,以及适应不同场合和目的,这在过去局限于现有素材的单一模态技术中很难实现。

虽然目前国内也有一些类似HeyGen的AI视频应用,比如腾讯智影、一帧秒、万彩微影等,但这些应用也只是利用AI技术来简化视频创作。

处理并提供文字配音、文章转视频、数字真人直播等功能。

但就具体生成效果而言,国内应用在视频清晰度、素材丰富度、定制化功能等方面与HeyGen等应用仍有较大差距。

视频AI的突然崛起揭示了什么?

总体而言,此类应用仍然只能在平台提供的素材库内选择有限的元素进行创作,并且在某些类别(例如数字真人视频)上,国内应用生成的视频还没有达到HeyGen视频的水平。

如此流畅、现实的标准。

如果说,在这一轮AI革命中,国内视频AI技术仅仅停留在“降本”阶段,长远来看,还远远不足以征服智能时代的观众。

从目前观众的态度来看,AI制作的视频仍处于“不受欢迎”的状态。

许多观众仍然认为在视频中使用人工智能技术是一种懒惰、不负责任和廉价的制作方式。

原因在于,目前国内的一些人工智能技术还没有突破感官门槛,人们仍然清晰地感觉到“这不是人类做的”。

从而给人一种“没有感情”、“粗制滥造”的印象。

更重要的是,使用AI技术的视频甚至被贴上“营销号”的标签。

面对这样的环境,任何一个爱惜自己羽毛的视频创作者都不敢轻易使用AI技术,生怕被视为“营销号”,被贴上“粗制滥造”的标签。

生成式AI的进步确实大大简化了视频制作流程,但在已经到来的智能时代,观众不再希望看到那些批量、流水线的“劣质”视频。

要想摆脱这样的“劣质”标签,真正让作品有情感、有灵魂,除了不断“降低成本”之外,在个性化、逼真度、素材丰富度等方面,国内视频AI还有很长的路要走去。

【本文由投资界合作伙伴微信公众号授权:AI新智能。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

视频AI的突然崛起揭示了什么?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 河北省20亿机器人产业基金招募GP

    河北省20亿机器人产业基金招募GP

    河北省机器人产业基金子基金及储备项目征集公告根据省政府办公厅《关于印发河北省支持机器人产业发展若干措施的通知》(冀政办字【〔】31号)河北省产业投资引导基金股份有限公司发起设立20亿元河北省机器人产业基金,重点投资机器人、智能制造、人工智能领域。 为加快基金投

    06-17

  • 万里汇推出首个B2B贸易履行、支付和交易保障产品WorldTrade

    万里汇推出首个B2B贸易履行、支付和交易保障产品WorldTrade

    4月15日,中国进出口商品交易会(以下简称广交会)在广州如期开幕。 蚂蚁集团一站式企业跨境 以“连接、加速、科技”为主题,全球数字支付及金融服务平台WorldFirst携“收款、支付”五合一跨境支付解决方案闪亮登场、管、汇、贷”,同时还发布了跨境支付解决方案。 WorldTrad

    06-18

  • 中国网络电视台将引入战略投资者启动上市程序

    中国网络电视台将引入战略投资者启动上市程序

    中国网络电视台将引入战略投资者启动上市程序。 据香港媒体报道,央视国际网络有限公司总经理汪文斌近日表示,公司正在进行股份制重组,将于近期上市;此外,公司还将引进战略投资者并启动上市融资相关手续。

    06-18

  • 新加坡科技公司 Advance Intelligence 获超 4 亿美元 D 轮融资,估值超 20 亿美元

    新加坡科技公司 Advance Intelligence 获超 4 亿美元 D 轮融资,估值超 20 亿美元

    投资界(ID:pedaily)9 月 23 日,由新加坡科技公司 Advance Intelligence 推动的科技公司 Advance Intelligence新加坡AI科技集团)今天宣布完成超4亿美元的D轮融资。 本轮融资由软银Vision Fund II和华平投资领投,北极星资本、元璟资本、高榕资本和新加坡经济发展局投资跟

    06-18

  • 新锐西式快餐品牌“麦堡王”获3500万元A轮融资

    新锐西式快餐品牌“麦堡王”获3500万元A轮融资

    据投资界9月14日消息,新锐西式快餐品牌“麦堡王”获万元投资A轮融资,由零点三(北京)国际贸易有限公司投资,变华资本领投,攀威联合科技(北京)有限公司跟投。 本次融资主要用于商学院成立、连锁店供应链建设、公司品牌升级、推广及团队拓展。 本次融资将为公司下一步快

    06-18

  • 清科季报:2022Q1新增资金募集总额同比小幅下降,其中外币资金大幅下滑

    清科季报:2022Q1新增资金募集总额同比小幅下降,其中外币资金大幅下滑

    01 市场总体情况 募资市场复苏趋势放缓,募集资金总额今年一季度募集资金同比小幅下降,受国际形势和国内疫情反复影响,受疫情影响,我国股权投资市场募资环境恢复速度放缓。 经历同比补充性增长后,今年一季度新增募集资金数量和规模在疫情防控常态化下逐渐回归正常水平,总

    06-18

  • “交朋友”是AI行业的新方向

    “交朋友”是AI行业的新方向

    Snapchat最近遇到了大麻烦。 英国隐私监管机构信息专员办公室(ICO)向 Snapchat 发出了初步执法通知,因为 ICO 认为 Snapchat 在推出 MyAI 之前没有充分评估 AI 技术带来的数据保护风险,使得 MyAI 存在潜在危险。 不过,ICO强调,这只是临时调查结果。 Snapchat可以提供证据

    06-21

  • 爱立信第四季度净利润同比增长60%,全年销售额达2324亿

    爱立信第四季度净利润同比增长60%,全年销售额达2324亿

    爱立信发布年度财报。 财报显示,今年第四季度,爱立信实现净销售额9000万瑞典克朗,同比增长5%;净利润为71.9亿瑞典克朗,去年同期为44.8亿瑞典克朗,同比增长60%。 听,中小企业反馈平台。 倾听用户需求,倾听创业者声音,解决中小企业痛点。 点击立即参与调查并获得礼物。

    06-17

  • 首届人工智能摄影奖揭晓,读完获奖作品,我两次惊慌

    首届人工智能摄影奖揭晓,读完获奖作品,我两次惊慌

    几年前,“现代主义之父”查尔斯波德莱尔对摄影技术提出了著名的批评——“每一个天才都是画家的避难所,他们没有能力或懒得完成自己的工作”。 教育。 ”近百年来,摄影技术不断发展,这项备受争议的新技术终于在各个领域完善为一门艺术。 从构图到光影,从景深到色彩,摄影

    06-21

  • 阿尔法都打败了李世石,为什么愚人节不能庆祝3W科技日?

    阿尔法都打败了李世石,为什么愚人节不能庆祝3W科技日?

    这个时代最可悲的是——你努力,却跟不上潮流;你很聪明,但你不跟上潮流。 了解趋势,胜利就在眼前。 “人机一体化”时代,智能化就是未来!世界上没有后悔药,但你可以选择“早点知道”。 当互联网冲击高科技,智能生活成为人人都可以参与的游戏。 来到3W,您可以与智能专家

    06-18

  • 海湖海淘已完成5000万元A轮融资,预计今年9月实现盈利

    海湖海淘已完成5000万元A轮融资,预计今年9月实现盈利

    据投资界7月21日消息,海外官网直邮跨境电商海湖海淘平台宣布完成辰海资本领投的A轮融资。 投资、杭州华北投资管理合伙企业等共同投资1万元人民币A轮融资。 据悉,本轮融资将主要用于加强供应链和市场推广。   海虎海淘成立于今年3月,隶属于杭州淘分吧网络科技有限公司。

    06-18

  • 湃道智智能完成百度风投数千万元Pre-A轮融资

    湃道智智能完成百度风投数千万元Pre-A轮融资

    据投资界7月28日消息,据36氪报道,湃道智智能正式宣布获得数千万元融资获得百度Pre-A轮融资。 风险投资(BV)。 此前,湃道智智能还获得了启明创投的天使轮融资。 耀明智智能成立于2016年,主要聚焦石油、化工等传统工业市场,为大型企业提供工业安全领域的AI+RPA解决方案。

    06-18