首页 > 科技未来 > 内容

Sora会“扼杀”降息吗?

发布于:2024-06-18 编辑:匿名 来源:网络

Sora的出现,对于张一鸣来说既是欣喜又是担忧。

曾经被OpenAI的ChatGPT震惊的大型AI模型行业,再次被该公司最新的视频生成模型Sora震惊。

与Runway、Pika等只能生成10秒以内的视频、拍摄角度单一、内容扭曲程度较高不同,Sora的视频生成长度不仅超过60秒,还可以实现多角度镜头切换。

单视频,还可以最大程度还原现实世界的真实场景。

在ChatGPT上已经验证过的模型性能的缩放规律,被OpenAI CEO阿尔特曼移植到了视频领域,证明了他的“强化才能创造奇迹”的策略仍然有效,即增加模型的尺寸将会持续下去以提高性能。

被ChatGPT称赞的“智能涌现”功能再次出现在Sora身上。

面对Sora的“降维攻击”,AI视频领域的一些创业者,比如Runway CEO克里斯托瓦尔·巴伦苏埃拉,已经做好了“Game On”的准备,也有一些,比如皮卡·创始人·郭文景,已经开始准备进攻。

有些人,比如 Stability AI 首席执行官 Emad Mostak,不禁感叹“阿尔特曼真是魔术师”,并将Sora视为 AI 视频行业的 GPT-3 时刻。

但对于字节跳动来说,这或许不是一个好消息,因为Sora所在的视频生成赛道,正是字节跳动剪辑目前瞄准的AI创新方向。

继2月份从抖音转向电影放映后,界面新闻报道称,抖音前CEO张楠即将推出一款生成照片和视频的AI产品。

张楠正打算在人工智能视频领域大展拳脚。

在产品还没能推出之前,他内部开办新业务的计划最先遭到了Sora的打击。

OpenAI是张楠决心押注AI、创业的催化剂。

OpenAI图形模型DALL-E 2的发布,让张楠第一次直观地感受到AI图像生成对传统内容创作方式的颠覆力量。

这就是字节跳动全球CEO梁如波所说的“将产生‘新创意平台’的机会,也是促使张楠转行电影剪辑的原因之一。

生成式AI仍然是打开成长天花板的必要尝试。

”字节跳动在2018年的公开信中提到,字节跳动不能错过AGI(通用人工智能),并指出AGI是TikTok在全球发现新增长机会不可或缺的合作伙伴,“它可以解决字节跳动的第二个”。

曲线增长困境。

“2017年剪辑的出现,帮助内容生态从PGC(专业机构制作的内容)转向UGC(用户生成内容),大大降低了用户创作的门槛。

现在,随着平台内容生态转向PUGC融合状态下,其对用户制作视频的成本和整体质量提出了新的要求,AI生成视频产品的出现为每个普通人降低视频制作门槛提供了现实的可能,抖音。

甚至TikTok也有望迎来内容创作者数量的新爆发,值得一提的是,AI视频生成是一个颇具前景的创业赛道,到了年底,该赛道已经涌现出一批独角兽。

公司:Midjourney估值40亿美元,Runway估值15亿美元,年初崭露头角的新贵Pika成立不到一年,估值已达美国。

2.5亿美元。

在Sora的突然袭击下,留给张一鸣和张楠孵化下一个AI视频一代独角兽的时间变得越来越紧张。

在Sora亮相之前,Byte 也在 1 月份开发 AI 视频生成产品。

字节跳动的研究人员在 arXiv 上发表了一篇论文,介绍了字节正在开发的一种文本生成视频模型,名为 MagicVideo-V2,该模型集成了多个模块,包括文本转图像模型、视频运动生成器、参考图像嵌入模块和插值模块实现文本到视频的自动生成。

MagicVideo-V2想要解决的问题是Runway和Pika生成的视频中显示的低保真度和运动。

不自然、分辨率低、样式缺乏多样性等。

Byte的产品砍掉了原有的“图像转文字”功能模块,在转换过程中也面临着上述问题。

静待MagicVideo——随着V2研发日趋完善,从演示走向量产,张楠在一个多月的用户访谈中收集到了更多一线创作者对AI生成视频产品的不满和期待。

其中之一包括一些创作。

“为了更好地表达自己的想法,用一款产品完成所有创作几乎是不可能的。

他们必须跨越多种产品,并使用复杂的编辑和交互过程来完成他们的表达。

” “去年8月,UP Master Digital Life Kazik制作的一段热门视频《流浪地球3预告片》使用了MidJourney、Runway等多款产品,经过了5天的后期剪辑和拼接。

结果,UP Master Digital LifeKazik创建困难的主要原因是AI软件不够智能和便捷。

在Sora出现之前,业界默认的视频方式是仅输出单一且通常是静态视角的片段,背景大多是赛博朋克风格。

Sora出现后,文森特视频领域的旧知被打破。

无论多复杂的视角或场景切换,只需一个提示词即可生成。

在兼顾便利性的同时,最大限度地保证生成的内容与真实物理一致。

世界相关性。

Sora提示词示例来源:官网截图 字节和张楠规划的AI视频应具有更高保真度的生成效果、更清晰的生成画面、更流畅自然的逻辑理解能力等,这些都被Sora首先一一采用。

完成。

需要注意的是,尚未开放接受外部检验的Sora仍有很多不完善的地方。

按照他的官方说法,“目前仍处于世界模式研究和应用的早期阶段”。

Meta首席科学家杨立坤直接质疑Sora:“仅仅能够根据提示生成逼真的视频,并不意味着系统真正了解物理世界。

”OpenAI在官网介绍中也提醒,Sora可能很难准确模拟物理世界。

复杂场景的原理,可能无法理解因果关系。

线索的空间细节可能会混淆,例如左和右,并且可能很难准确地描述随时间变化的事件,例如遵循特定的摄像机轨迹。

这些缺陷可能会导致Sora生成不合逻辑的视频,例如一个人在跑步机上跑错方向。

这些未解决的 bug 是 OpenAI 决定不全面开放Sora的原因之一。

今天,OpenAI正在选择部分用户进行内部测试,评估关键领域的潜在危害或风险,以获得有价值的反馈,从而推动模型的进展。

ChatGPT发布后,外界开始意识到实现AGI时代的可能性。

像Sora这样的视频生成模型无疑是AGI到来的重要加速器。

OpenAI在官网直接写道:“Sora为能够理解和模拟现实世界的模型提供了基础。

我们相信这种能力将是实现AGI的重要里程碑。

”我们想用视频生成模型来宣传AGI带来的好处,OpenAI不仅仅是一家公司。

去年12月,Runway提议开发通用世界模型,并使用其视频生成Gen-2来模拟整个世界。

“我们相信人工智能的下一个重大进步将来自于对视觉世界及其动态的理解。

”系统,这就是为什么我们正在围绕通用世界模型开始新的长期研究工作。

”了解现实世界的物理定律已成为通向 AGI 的唯一途径。

创始人周鸿祎在评论Sora时直言,一旦AI连接到摄像头并观看所有现有视频,其理解世界的能力将远远超过文本学习。

“这离AGI确实不远了,不是10年、20年的事情,一两年可能很快就能实现。

”正是在AGI相关概念的刺激下,AI影像、视频领域的各大垂直品类应运而生。

模型公司估值飙升,涌现出Midjourney、Stability AI、Runway等一批明星独角兽初创公司。

具体到字节跳动的业务层面,图片/视频生成还可以帮助提升字节跳动的商业化需求,比如帮助字节跳动广告主低成本、便捷地制作视频。

Byte相关人士告诉PostLate,Byte广告主总广告成本的10%-20%是视频制作成本。

从去年开始,字节一直在开发一些相关产品,帮助广告商减少这部分投入。

虽然在推出类似文森视频的产品上落后了一步,但对于张楠来说,反过来也迎来了一次触碰Sora的过河机会。

在ChatGPT出现之前,算法的缺陷一度是业界开发大型对话模型的主要障碍之一。

人工智能专家丁磊博士解释说,一些大型模型初创公司“不太擅长训练大型模型……如果训练方法不对,那么无论你有多少GPU都是无用的”。

在追逐Sora的过程中,皮卡·创始人·郭文景提到,当前生成视频发展的一个重要限制是算法的成熟度。

“大家都已经知道语言对话模型的大致方法,算法也比较成熟。

但之前没有针对视频的好的算法。

”Sora的发布,无疑再次为业界提供了有效的解决问题思路,也为郭文景、张楠等同领域的创业者提供了成熟的算法参考路线。

随着Sora的正式登场,在上一波语言对话模式中落后的字节跳动,在视频领域再次陷入被动追赶的局面。

继2019年11月ChatGPT发布后,百度、阿里巴巴等国内各大厂商于去年3月、4月相继推出自主研发的大模型文心一言和同易千言。

不过,直到8月,字节才推出了Skylark大号机型。

行动迟缓的后果之一是,虽然文心一言的月活跃度已经突破1亿,但字节的同类产品“豆宝”的月活跃度却不足1000万。

在1月底的新一期《全体员工》(员工面对面)中,梁如波重点以人工智能进展缓慢来说明公司正在变得不景气的现状,并表示“半年技术公司层面的审查直到2019年才开始考虑GPT,而业界做得好的大模型初创公司都是2000年至2008年创立的。

“字节关注大模型还不算太晚。

”据 LatePost 报道,2018 年 6 月 OpenAI 发布 GPT-3 后,字节跳动训练了一个拥有数十亿参数的大型生成语言模型。

由于参数规模有限,模型的生成能力一般,字节跳动当时看不出来。

对于商业化的可能性,“ROI(投资回报率)无法计算”,所以这次探索还只是一个零星的探索。

如今选择张楠这样的大将来用AI改造影片,被外界视为字节希望加快AI发展的信号。

但完成内部兵力部署后,留给张楠的挑战不仅是时间紧迫,还有外部芯片供应中断带来的算力短缺问题。

去年10月,对NVIDIA A、A、H、H、L40S等五款GPU芯片的禁令正式生效。

对于国内很多大型模型厂商来说,NVIDIA芯片的停产客观上成为了他们追求ChatGPT乃至GPT-4的最大障碍。

在缩放定律的指导下,阿尔特曼提出了大模型时代的“摩尔定律”,芯片需求每三四个月就会翻一番。

这无疑再次提高了张楠追赶Sora的门槛。

“对于国内厂商来说,这种大力创造奇迹的模式成功后,硅谷将进入更加狂热的算力军备竞赛,字节的算力短板将被进一步放大。

”招商证券研究员刘芳表示。

参考资料:《剪映全员信》张楠《揭秘字节AI版图:调集多位高管参战,数款重磅产品内测》科技星球《大厂大模型:久违的一把手工程》LatePost《“今天,所有VC的会上都在谈Sora”》Venture.com《Sora发布后,Pika创始人*回应钛媒体:很振奋,我们将直接冲》钛媒体【本文由投资界合作伙伴微信公众号授权:字母榜,仅此可见平台信息存储服务。

】如有任何疑问,请联系投资界()。

Sora会“扼杀”降息吗?

Sora会“扼杀”降息吗?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 北京博瑞耀明创业投资有限公司上官鸿:文化创意产业并购机会很多

    北京博瑞耀明创业投资有限公司上官鸿:文化创意产业并购机会很多

    图为副总经理与北京博瑞董事会、监事会成员上官鸿盛德创业投资有限公司  投资界消息12月15日,中国文化与金融创新峰会在北京举行。 北京博瑞耀明创业投资有限公司董事会、监事会成员上官鸿表示,博瑞耀明早期并购一直采取全现金方式,“因为我们上市公司拥有非常充裕的现金

    06-17

  • 麦穗获数千万元Pre-A轮融资,智通人才领投

    麦穗获数千万元Pre-A轮融资,智通人才领投

    据投资界3月22日消息,麦穗近日透露已获数千万元Pre-A轮融资的融资。 本轮融资由智通人才领投。 投资和盈益资本也参与了投资。    据悉,本轮融资资金将主要用于人工智能技术研发、开发新业务产品以及营销团队建设。   按麦穗联合创始人王露颐介绍的说法:麦穗就像一台优

    06-17

  • 继抖音升级整改后,西瓜视频也将暂时关闭手机视频上传功能

    继抖音升级整改后,西瓜视频也将暂时关闭手机视频上传功能

    据投资界4月12日消息,记者获悉,西瓜视频已主动停止手机视频上传、直播、弹幕等产品的功能也将于4月10日暂时关闭,具体功能恢复时间将根据后续整改情况确定。   西瓜视频表示,将严格按照《互联网视听节目服务管理规定》进一步完善标准,对平台现有及过往内容进行全面自纠

    06-17

  • 韵达股份:5月份快递服务业务收入32.49亿元,同比增长22.79%

    韵达股份:5月份快递服务业务收入32.49亿元,同比增长22.79%

    韵达股份晚间公告,公司5月份快递服务业务收入32.49亿元,同比增长22.79%;快递业务单票收入为2.02元,同比下降0.98%。

    06-17

  • 阿里云携手九家领先企业向中小企业开放需求场景

    阿里云携手九家领先企业向中小企业开放需求场景

    随着客户需求的日益变化,越来越多的大企业选择通过“开放创新”模式来提高创新效率,即、购买外部技术或投资中小企业,基于外部研究成果,与创新型企业进行共创,实现共赢。 正因为如此,创业初期的企业只要拥有雄厚的技术实力和独特的创新理念,就有机会与行业领军企业合作

    06-17

  • AI芯片下半场:群雄围攻NVIDIA

    AI芯片下半场:群雄围攻NVIDIA

    NVIDIA现在过得非常红火。 从虚拟货币热潮到AI大模型时代,英伟达这几年的发展速度超过了之前任何时期,也助推了这家芯片公司市值成功突破1万亿美元大关。 不过,相比于虚拟货币城堡般的虚拟经济,大型AI模型带来的“真实需求”才是英伟达突破万亿市值大关的核心驱动力。 据

    06-17

  • 方豹春季发布会:豹5全产品矩阵首发

    方豹春季发布会:豹5全产品矩阵首发

    4月16日,“方华”方豹汽车春季发布会在深圳举行。 现场,方豹汽车总经理熊甜波正式发布了方豹产品矩阵:新能源越野标准定义者豹5、硬核旗舰豹8、豹3概念车SUPER 3和概念跑车SUPER 9。 四种型号充分满足用户的个性化需求。 ,重点展示方程豹针对汽车产品形态和用户生活的全新

    06-18

  • 呼叫中心系统在零售行业的实际应用:优化客户服务,提升销售业绩

    呼叫中心系统在零售行业的实际应用:优化客户服务,提升销售业绩

    .wp-block-column h3{margin-left:0} 在当前竞争激烈的零售行业,提供卓越的客户服务已成为商业成功的关键因素之一。 Udesk呼叫中心系统通过其先进的功能和智能化的特性,为零售企业提供了一套全面的解决方案,从而在优化客户服务、提高销售业绩方面取得了显着的效果。 1、智

    06-18

  • Sensor Tower:腾讯《王者荣耀》 3 月全球营收 2.57 亿美元,同比增长 63%

    Sensor Tower:腾讯《王者荣耀》 3 月全球营收 2.57 亿美元,同比增长 63%

    Sensor Tower 商店情报数据显示,腾讯《王者荣耀》 在全球 App Store 和 App Store 吸金 2.57 亿美元3月份的Google Play,与今年3月份相比,增长了63%,重回冠军在全球手游畅销榜的宝座。 中国应用商店收入占比96.3%,海外版本占比3.7%。 腾讯《和平精英》和《PUBG Mobile》

    06-18

  • “企云方”获数千万元Pre-A轮融资,戈壁创投领投

    “企云方”获数千万元Pre-A轮融资,戈壁创投领投

    投资界(微信ID:pedaily)3月3日报道,企云方科技完成数千万元Pre-A轮融资,戈壁创投领投。 一轮融资。 本轮融资由戈壁创投领投,用友产业基金跟投。 投资界人士表示,本轮融资将用于推动产品研发优化,以及企业营销和技术团队的扩充。 企云方科技于2016年在美国硅谷成立研发

    06-18

  • “交朋友”是AI行业的新方向

    “交朋友”是AI行业的新方向

    Snapchat最近遇到了大麻烦。 英国隐私监管机构信息专员办公室(ICO)向 Snapchat 发出了初步执法通知,因为 ICO 认为 Snapchat 在推出 MyAI 之前没有充分评估 AI 技术带来的数据保护风险,使得 MyAI 存在潜在危险。 不过,ICO强调,这只是临时调查结果。 Snapchat可以提供证据

    06-21

  • 天津乡村振兴引导基金启动,规模25亿

    天津乡村振兴引导基金启动,规模25亿

    投资界消息(ID:pedaily),6月8日,天津乡村振兴基金正式启动。 基金规模25亿元,最终撬动资金及项目群规模达1亿元。 据悉,天津乡村振兴基金是25亿元政府引导基金,与金融机构、企业等社会资本合作,共同发起设立多个基金中的基金,形成具有规模的乡村振兴基金中的基金集团

    06-17