首页 > 科技未来 > 内容

Sora证明了马斯克是对的，但特斯拉和人类可能已经失去了

发布于：2024-06-18 编辑：匿名来源：网络

Sora证明了特斯拉的想法是对的，特斯拉证明了Sora的价值不仅仅是生成视频。

Sora推出后，马斯克可能是心情最复杂的一个。

不仅因为他早年与OpenAI的纠葛，还因为Sora意识到的其实正是特斯拉这几年一直在探索的方向。

2月18日，马斯克在科技@Dr.KnowItAll的主播题为《OpenAI的重磅炸弹证实了特斯拉理论》的视频下留言称，“特斯拉已经能够利用精确的物理原理制作真实世界的视频大约一年了”随后他在X上转发了一段2018年的视频，视频中特斯拉自动驾驶总监Ashok·埃勒斯瓦米（Ashok Elluswamy）向外界介绍了特斯拉如何利用AI模拟现实世界的驾驶，视频中AI生成了7个不同角度的驾驶视频。

同时，只需输入“直行”或“变道”等指令，即可使这七个视频同时变化。

当然，这并不意味着特斯拉早年就掌握了Sora的技术。

毕竟在一年前，特斯拉的生成技术只是用来模拟车辆驾驶，Sora能够处理的环境、场景、提示、物理规律等信息更加复杂。

但特斯拉AI和Sora的训练思路是一样的：不是训练AI如何生成视频，而是训练AI理解并生成一个真实的场景或世界。

视频只是一段时间和空间，从某个角度观察这个场景。

这是两家现有业务完全不同的公司。

他们使用不同的方法来感知现实世界。

他们都希望实现的是AGI（人工智能），或者更具体地说，是体现智能。

和智能代理。

理解这个观点的核心是理解OpenAI赋予Sora的使命。

它不仅仅是取代视频生成的创造者，而是将视频生成作为“模拟器”来帮助AI理解现实世界。

如果说特斯拉的百万载具还需要用“肉身”来体验世界，那么Sora则完全依靠数据输入来构建他对世界的认知。

在OpenAI官网上，这篇关于Sora的研究论文被称为《把视频生成模型作为世界模拟器》。

请关注关键字“世界模拟器”，它比生成视频更关键。

事实上，早在特斯拉发布FSD V12时，这家以汽车为主要消费产品的人工智能公司就已经展示了类似的能力。

怎么理解呢？首先，在FSD V12上，工程师删除了超过30万行定义驾驶规则的代码。

系统将从“喂”来的驾驶视频中学习如何处理真实的驾驶场景，而不是像过去那样遵循书面规则。

在特定场景下执行特定命令的规则。

当然，与Sora那样的“生成模型”不同，FSD的目标是实现自动驾驶，因此它并不需要实际生成特定的视频。

您可以想象一个人（或代理人）执行“防御性驾驶”。

它可以根据过去的经验，对周围环境中交通参与者的下一步运动趋势做出判断。

这个判断只需要存在于你的脑海中，不需要实际画在纸上。

因此，特斯拉的FSD不需要生成未来的真实视频并将其呈现在车辆的某个屏幕上。

因此，现在出现了OpenAI和特斯拉这两家完全不同的公司，用完全不同的方法和路径来实现“通过视频生成让AI理解物理世界”的同一个目标。

我们简单看一下Sora的操作逻辑：OpenAI表示，Sora结合了过去几年最重要的两个模型Transformer和Diffusion。

ChatGPT、Gemini、LLaMA等语言模型都是基于Transformer模型，对单词进行标签并生成下一个单词；扩散模型是“文森特图”的代表。

如果从“理解世界”的角度来看待Sora，那么某一帧图像的质量和关系绝不是评判模型好坏的标准。

就连官网发布的60秒单镜头视频也不是核心部分。

重要的是，生成的视频是可以编辑的——在不同的机位下，无论是广角、中景、近景、特写，视频中的人物与背景的关系都保持着高度的还原度。

“一致性。

”这就是Sora离现实越来越近的地方。

这可以结合特斯拉的“纯视觉”FSD方法来理解。

简单来说，99%的车企或者智能驾驶团队都会在车辆上搭载激光雷达，通过激光束的发射和接收来辅助计算周围物体与车辆的距离关系。

但马斯克不仅删除了30万行代码，还去掉了雷达，仅依靠高清摄像头采集和神经网络学习来确定距离关系。

这对于特斯拉和OpenAI来说都是一个巨大的挑战。

毕竟输入图像是2D的，但输出结果（无论是驾驶指令还是视频）需要基于对3D世界的深刻理解。

规模和质量是培训模式的核心。

特斯拉的数据来自于真实道路上配备传感器的车辆；而OpenAI的大量数据，从目前公开的信息来看，都来自于互联网。

从质量上来说，在《马斯克传》中，作者Isaacson写道，特斯拉通过与Uber合作，获得了“五星级司机”培训FSD的材料；而从规模来看，奥特曼最近希望筹集数万亿资金，那就是重视算力和规模的具体体现。

最后回到最初的问题，为什么我们认为Sora和FSD v12很相似？Sora和OpenAI的未来想象是什么？它们与 AGI 有什么关系？马斯克表示，当人工智能能够真正解决问题（物理、数学、化学等）时，AGI 就到来了。

Sora证明了马斯克是对的，但特斯拉和人类可能已经失去了

但理解还有另一个维度，那就是具身智能。

毕竟，现实世界不仅仅是数学公式和书面规则。

具有一定智商的小猫小狗也可以依靠运动与物理世界真正互动。

这对于过去只能输入二维信息的AI来说是很难实现的。

这也是马斯克在见到Sora后评价X为“GG人类”的原因。

在他看来，Sora今天所做的一切打破了过去的次元壁，AI可以理解现实世界并持续学习。

进一步影响现实世界的能力。

而就像特斯拉用这种生成能力来训练车辆一样，Sora的价值不仅仅在于生成一段真假难辨的视频，并将其作为影视创作者的生产力工具（虽然这是一个很困难且迫切需要的场景）。

正如周鸿祎所说，“Sora只是尽力而为，它展现的不仅仅是一个视频制作能力，而是一个大模型，在理解和模拟现实世界后会带来新的结果和突破。

” 【本文由投资界合作伙伴微信公众号授权：极客公园。

本平台仅提供信息存储服务。

】如有任何疑问，请联系投资界（）。

#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态，提供一站式资讯服务，实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。

趋势和行业变化，以及对未来技术趋势的洞察。

站长声明

标签：

上一篇：阿里相聚惠州，创新未来——阿里云创新中心（合肥高新）基地线上发布招商会正式开幕！ 11月8日

下一篇：“五科金硅”完成A+轮融资，吉利资本、清流资本领投

长文-母基金大佬的发声：我们钱多人不傻，你们的历史、分红、所关注行业，我们都非常在意！

长文 |基金老总的声音：我们有很多钱，也不傻。我们关心您的历史、您的股息、您关注的行业！ 2019年7月12日，由清科集团主办的《第十一届中国基金合伙人峰会》在北京如期举行。峰会邀请知名优秀母基金、政府引导基金、上市公司、保险资金、私人银行、财富管理机构、富裕家族

06-17
巨头正在争夺AI电商， “数字人”什么时候才能领先？

正当拼多多低价策略迭代电商行业时，阿里也吹响了下半年攻势的号角——AI电商时代即将到来，行业或将重新洗牌。事实上，AI电商战场的硝烟已经悄然燃起。 2018年，阿里巴巴、京东、字节跳动、腾讯、百度等平台相继宣布自主研发大模型“同易前文”、“言犀”、“云雀”、“混元

06-17
脑机接口新发现！入睡后，大脑会重播我们清醒时的经历

入睡后，我们的大脑会进入离线状态，打开Replay模式，重播我们清醒时的经历，记忆就会恢复。此前，科学家只在啮齿动物等非人类动物中观察到这一过程。在脑机接口的试点临床试验中，麻省总医院、哈佛医学院、布朗大学、加州大学圣地亚哥分校等机构的研究人员团队首次观察到学

06-18
数字健康平台“微医”最快本月在港IPO

数字健康平台“微医”最快本月在港IPO。据路透社报道，微医数字健康业务量同比增长%。微医计划在香港上市，名称为微医控股，这是一家分拆的数字医疗平台。其业务主要包括医疗服务和养生服务，其中会员制养生服务占其收入的50%以上。微医会员制数字慢病管理服务全年会员数

06-17
东车日报｜特斯拉股东呼吁罢免马斯克-比亚迪与丰田首款合资车型上市-奔驰召回超7万辆汽车

介绍劳斯莱斯首款纯电动车闪亮上市，万元起一汽丰田bZ3已正式开始预售。 ROBO-01量产版将在广州车展上展出。疑似奇瑞、华为、宁德时代联合打造的首款车型。谍照曝光，特斯拉股价跌超60%，股东呼吁更换马斯克。梅赛德斯-奔驰召回超过7万辆进口和国产汽车。魅族未来产品规划

06-21
金禾商业正式登陆上海证券交易所，募资总额7.47亿元

据投资界4月22日消息，上海金禾商业运营管理有限公司（以下简称“金禾商业”） ”）在上海证券交易所上市。股票简称“金禾商业”，股票代码“82”。金禾商业本次发行新股1万股，募资总额7.47亿元。上市首日开盘后逆势大涨43.99%，收于11.39元。金禾商业成立于2007年，总

06-18
在线旅游公司Kayak计划通过IPO融资1亿美元

北京时间7月9日，据科技网站AllThingsD报道，在线旅游公司Kayak软件计划通过首次公开募股(IPO)筹集10万美元。 Kayak将在纳斯达克证券交易所上市，股票代码为KYAK。　　根据美国证券交易委员会文件，Kayak表示将发行1万股股票，最高融资目标为1亿美元。　　本次公开发行将由

06-18
vivo X9发布会倒计时：点亮广州之美

大家都知道vivo即将推出他们最新的旗舰产品vivo X9，而X9的广告也铺天盖地。它承认彭于晏为代言人，甚至在全国各大电视平台上赞助广告。可以说宣传经费都在烧！这也说明vivo对于vivo X9有着非常高的期待。这个架势看来至少在销量上超越了它的兄弟X7。 vivo昨天也正式启动

06-18
致力于大数据产业应用，中科泽达获数千万元融资

据投资界人士透露，中科泽达（北京中科泽达科技有限公司）已获数千万元融资12月融资。中科泽达是由中国科学院计算机网络信息中心投资设立的高新技术企业。依托大数据分析与计算技术国家地方联合工程实验室和中科院计算机网络信息中心的优秀资源，拥有国家级数据中心服务经

06-18
洞察日本游戏市场：玩家特征——日本游戏出海白皮书系列文章2

1.付费情况日本手游玩家花钱意识调查报告显示，日本玩家的游戏消费有所下降。参与调查的知名玩家中，月均消费（日元至日元以内）最低的人数最多，共有370人；而拥有100万日元以上的人只有三人。根据花费金额可分为：每月花费5万日元以上的核心玩家群体占2%；每月花费1万日

06-17
科聪完成A+轮融资，为移动机器人提供整体解决方案

据投资界（ID：pedaily）5月29日消息，近日，浙江科聪控制技术有限公司（“科聪”）移动机器人控制系统行业领军企业，完成A+轮融资。本轮融资由金蚂投资领投，老股东元璟资本继续跟投。本轮资金将主要用于产能扩张和建设，大幅增加产能，以满足销量爆发和放量的需求。同时

06-17
93亿美元！ KKR亚洲三期基金募集完成

投资圈（微信ID：pedaily）据6月2日消息，全球领先的投资机构KKR宣布已完成亚洲三期基金募资，总金额93亿美元。据悉，该基金将用于亚太地区的私募股权投资，KKR私募股权业务管理的全球资产超过1亿美元（使用截至今年3月31日的现有基金估值）。　　据悉，亚洲三期基金的投资

06-17