北京博瑞耀明创业投资有限公司上官鸿:文化创意产业并购机会很多
06-17
Sora的出现,对于张一鸣来说既是欣喜又是担忧。
曾经被OpenAI的ChatGPT震惊的大型AI模型行业,再次被该公司最新的视频生成模型Sora震惊。
与Runway、Pika等只能生成10秒以内的视频、拍摄角度单一、内容扭曲程度较高不同,Sora的视频生成长度不仅超过60秒,还可以实现多角度镜头切换。
单视频,还可以最大程度还原现实世界的真实场景。
在ChatGPT上已经验证过的模型性能的缩放规律,被OpenAI CEO阿尔特曼移植到了视频领域,证明了他的“强化才能创造奇迹”的策略仍然有效,即增加模型的尺寸将会持续下去以提高性能。
被ChatGPT称赞的“智能涌现”功能再次出现在Sora身上。
面对Sora的“降维攻击”,AI视频领域的一些创业者,比如Runway CEO克里斯托瓦尔·巴伦苏埃拉,已经做好了“Game On”的准备,也有一些,比如皮卡·创始人·郭文景,已经开始准备进攻。
有些人,比如 Stability AI 首席执行官 Emad Mostak,不禁感叹“阿尔特曼真是魔术师”,并将Sora视为 AI 视频行业的 GPT-3 时刻。
但对于字节跳动来说,这或许不是一个好消息,因为Sora所在的视频生成赛道,正是字节跳动剪辑目前瞄准的AI创新方向。
继2月份从抖音转向电影放映后,界面新闻报道称,抖音前CEO张楠即将推出一款生成照片和视频的AI产品。
张楠正打算在人工智能视频领域大展拳脚。
在产品还没能推出之前,他内部开办新业务的计划最先遭到了Sora的打击。
OpenAI是张楠决心押注AI、创业的催化剂。
OpenAI图形模型DALL-E 2的发布,让张楠第一次直观地感受到AI图像生成对传统内容创作方式的颠覆力量。
这就是字节跳动全球CEO梁如波所说的“将产生‘新创意平台’的机会,也是促使张楠转行电影剪辑的原因之一。
生成式AI仍然是打开成长天花板的必要尝试。
”字节跳动在2018年的公开信中提到,字节跳动不能错过AGI(通用人工智能),并指出AGI是TikTok在全球发现新增长机会不可或缺的合作伙伴,“它可以解决字节跳动的第二个”。
曲线增长困境。
“2017年剪辑的出现,帮助内容生态从PGC(专业机构制作的内容)转向UGC(用户生成内容),大大降低了用户创作的门槛。
现在,随着平台内容生态转向PUGC融合状态下,其对用户制作视频的成本和整体质量提出了新的要求,AI生成视频产品的出现为每个普通人降低视频制作门槛提供了现实的可能,抖音。
甚至TikTok也有望迎来内容创作者数量的新爆发,值得一提的是,AI视频生成是一个颇具前景的创业赛道,到了年底,该赛道已经涌现出一批独角兽。
公司:Midjourney估值40亿美元,Runway估值15亿美元,年初崭露头角的新贵Pika成立不到一年,估值已达美国。
2.5亿美元。
在Sora的突然袭击下,留给张一鸣和张楠孵化下一个AI视频一代独角兽的时间变得越来越紧张。
在Sora亮相之前,Byte 也在 1 月份开发 AI 视频生成产品。
字节跳动的研究人员在 arXiv 上发表了一篇论文,介绍了字节正在开发的一种文本生成视频模型,名为 MagicVideo-V2,该模型集成了多个模块,包括文本转图像模型、视频运动生成器、参考图像嵌入模块和插值模块实现文本到视频的自动生成。
MagicVideo-V2想要解决的问题是Runway和Pika生成的视频中显示的低保真度和运动。
不自然、分辨率低、样式缺乏多样性等。
Byte的产品砍掉了原有的“图像转文字”功能模块,在转换过程中也面临着上述问题。
静待MagicVideo——随着V2研发日趋完善,从演示走向量产,张楠在一个多月的用户访谈中收集到了更多一线创作者对AI生成视频产品的不满和期待。
其中之一包括一些创作。
“为了更好地表达自己的想法,用一款产品完成所有创作几乎是不可能的。
他们必须跨越多种产品,并使用复杂的编辑和交互过程来完成他们的表达。
” “去年8月,UP Master Digital Life Kazik制作的一段热门视频《流浪地球3预告片》使用了MidJourney、Runway等多款产品,经过了5天的后期剪辑和拼接。
结果,UP Master Digital LifeKazik创建困难的主要原因是AI软件不够智能和便捷。
在Sora出现之前,业界默认的视频方式是仅输出单一且通常是静态视角的片段,背景大多是赛博朋克风格。
Sora出现后,文森特视频领域的旧知被打破。
无论多复杂的视角或场景切换,只需一个提示词即可生成。
在兼顾便利性的同时,最大限度地保证生成的内容与真实物理一致。
世界相关性。
Sora提示词示例来源:官网截图 字节和张楠规划的AI视频应具有更高保真度的生成效果、更清晰的生成画面、更流畅自然的逻辑理解能力等,这些都被Sora首先一一采用。
完成。
需要注意的是,尚未开放接受外部检验的Sora仍有很多不完善的地方。
按照他的官方说法,“目前仍处于世界模式研究和应用的早期阶段”。
Meta首席科学家杨立坤直接质疑Sora:“仅仅能够根据提示生成逼真的视频,并不意味着系统真正了解物理世界。
”OpenAI在官网介绍中也提醒,Sora可能很难准确模拟物理世界。
复杂场景的原理,可能无法理解因果关系。
线索的空间细节可能会混淆,例如左和右,并且可能很难准确地描述随时间变化的事件,例如遵循特定的摄像机轨迹。
这些缺陷可能会导致Sora生成不合逻辑的视频,例如一个人在跑步机上跑错方向。
这些未解决的 bug 是 OpenAI 决定不全面开放Sora的原因之一。
今天,OpenAI正在选择部分用户进行内部测试,评估关键领域的潜在危害或风险,以获得有价值的反馈,从而推动模型的进展。
ChatGPT发布后,外界开始意识到实现AGI时代的可能性。
像Sora这样的视频生成模型无疑是AGI到来的重要加速器。
OpenAI在官网直接写道:“Sora为能够理解和模拟现实世界的模型提供了基础。
我们相信这种能力将是实现AGI的重要里程碑。
”我们想用视频生成模型来宣传AGI带来的好处,OpenAI不仅仅是一家公司。
去年12月,Runway提议开发通用世界模型,并使用其视频生成Gen-2来模拟整个世界。
“我们相信人工智能的下一个重大进步将来自于对视觉世界及其动态的理解。
”系统,这就是为什么我们正在围绕通用世界模型开始新的长期研究工作。
”了解现实世界的物理定律已成为通向 AGI 的唯一途径。
创始人周鸿祎在评论Sora时直言,一旦AI连接到摄像头并观看所有现有视频,其理解世界的能力将远远超过文本学习。
“这离AGI确实不远了,不是10年、20年的事情,一两年可能很快就能实现。
”正是在AGI相关概念的刺激下,AI影像、视频领域的各大垂直品类应运而生。
模型公司估值飙升,涌现出Midjourney、Stability AI、Runway等一批明星独角兽初创公司。
具体到字节跳动的业务层面,图片/视频生成还可以帮助提升字节跳动的商业化需求,比如帮助字节跳动广告主低成本、便捷地制作视频。
Byte相关人士告诉PostLate,Byte广告主总广告成本的10%-20%是视频制作成本。
从去年开始,字节一直在开发一些相关产品,帮助广告商减少这部分投入。
虽然在推出类似文森视频的产品上落后了一步,但对于张楠来说,反过来也迎来了一次触碰Sora的过河机会。
在ChatGPT出现之前,算法的缺陷一度是业界开发大型对话模型的主要障碍之一。
人工智能专家丁磊博士解释说,一些大型模型初创公司“不太擅长训练大型模型……如果训练方法不对,那么无论你有多少GPU都是无用的”。
在追逐Sora的过程中,皮卡·创始人·郭文景提到,当前生成视频发展的一个重要限制是算法的成熟度。
“大家都已经知道语言对话模型的大致方法,算法也比较成熟。
但之前没有针对视频的好的算法。
”Sora的发布,无疑再次为业界提供了有效的解决问题思路,也为郭文景、张楠等同领域的创业者提供了成熟的算法参考路线。
随着Sora的正式登场,在上一波语言对话模式中落后的字节跳动,在视频领域再次陷入被动追赶的局面。
继2019年11月ChatGPT发布后,百度、阿里巴巴等国内各大厂商于去年3月、4月相继推出自主研发的大模型文心一言和同易千言。
不过,直到8月,字节才推出了Skylark大号机型。
行动迟缓的后果之一是,虽然文心一言的月活跃度已经突破1亿,但字节的同类产品“豆宝”的月活跃度却不足1000万。
在1月底的新一期《全体员工》(员工面对面)中,梁如波重点以人工智能进展缓慢来说明公司正在变得不景气的现状,并表示“半年技术公司层面的审查直到2019年才开始考虑GPT,而业界做得好的大模型初创公司都是2000年至2008年创立的。
“字节关注大模型还不算太晚。
”据 LatePost 报道,2018 年 6 月 OpenAI 发布 GPT-3 后,字节跳动训练了一个拥有数十亿参数的大型生成语言模型。
由于参数规模有限,模型的生成能力一般,字节跳动当时看不出来。
对于商业化的可能性,“ROI(投资回报率)无法计算”,所以这次探索还只是一个零星的探索。
如今选择张楠这样的大将来用AI改造影片,被外界视为字节希望加快AI发展的信号。
但完成内部兵力部署后,留给张楠的挑战不仅是时间紧迫,还有外部芯片供应中断带来的算力短缺问题。
去年10月,对NVIDIA A、A、H、H、L40S等五款GPU芯片的禁令正式生效。
对于国内很多大型模型厂商来说,NVIDIA芯片的停产客观上成为了他们追求ChatGPT乃至GPT-4的最大障碍。
在缩放定律的指导下,阿尔特曼提出了大模型时代的“摩尔定律”,芯片需求每三四个月就会翻一番。
这无疑再次提高了张楠追赶Sora的门槛。
“对于国内厂商来说,这种大力创造奇迹的模式成功后,硅谷将进入更加狂热的算力军备竞赛,字节的算力短板将被进一步放大。
”招商证券研究员刘芳表示。
参考资料:《剪映全员信》张楠《揭秘字节AI版图:调集多位高管参战,数款重磅产品内测》科技星球《大厂大模型:久违的一把手工程》LatePost《“今天,所有VC的会上都在谈Sora”》Venture.com《Sora发布后,Pika创始人*回应钛媒体:很振奋,我们将直接冲》钛媒体【本文由投资界合作伙伴微信公众号授权:字母榜,仅此可见平台信息存储服务。
】如有任何疑问,请联系投资界()。

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-17
06-17
06-18
06-21
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态