首页 > 科技未来 > 内容

大车型入侵自动驾驶

发布于：2024-06-18 编辑：匿名来源：网络

“自动驾驶的前提是安全、严谨。

对于大型模型来说，仅仅给出‘几乎’的结果是不够的。

”今年4月初，大车型刚问世时，一位自动驾驶领域人士表示，一位资深投资人向《自我象限》表达了对通用大车型在自动驾驶领域应用的担忧。

不乐观的原因有很多，比如大型车型的“废话”问题，导致大家认为它无法满足自动驾驶的安全级别要求；例如，每个人都认为大型模型解决了常见的推导问题，但自动驾驶解决了0.5%的极端情况；再比如，如果一个大型模型要在汽车端实现，需要先与算法进行整合，然后再整合，这将需要非常高的前端计算能力。

总而言之，通用汽车大模型的不确定性和自动驾驶的严谨性就像同一枚硬币的正反两面，也有几座短期内难以翻越的大山。

“这将是整个系统构建的问题，无法通过角度算法来改变。

”投资人总结道。

虽然不容乐观，但六个月后，大车型却嚣张地冲进了自动驾驶行业。

开枪的依然是特斯拉。

今年8月，特斯拉的端到端AI自动驾驶系统FSD Beta V12公开亮相，完全依靠车载摄像头和神经网络来识别道路和交通状况并做出相应决策。

国内，自动驾驶和大型模型公司已经开始密集布局。

9月，华为盘古大模型3.0推出自动驾驶行业大模型； 10月，在海谋第九届AI Day上，它也阐释了其在自动驾驶中的作用。

对该领域大型模型的一系列探索。

从结果来看，目前大模型对自动驾驶带来的改变可以分为两个方向：一是利用大模型作为工具，辅助自动驾驶算法的训练和优化过程；二是利用大模型作为工具，辅助自动驾驶算法的训练和优化过程。

另一种是利用大模型作为决策模型，直接驱动车辆并改变结果。

。

经过国内外的探索，这条看似矛盾的技术路径似乎正在一步步变得清晰。

那么大型车型能为自动驾驶带来什么？核心技术问题如何解决？ 01 大模型，取代自动驾驶训练引擎首先，大模型正在重塑自动驾驶的训练流程。

从讨论大模型的第一天起，从文本到图像生成，大家就已经深刻认识到大模型在提高工作效率方面的巨大潜力。

自动驾驶训练也不例外。

训练自动驾驶算法是一个漫长而庞大的工程，从数据采集、传输到管理；从数据清洗、标注、准备，最后投入自动驾驶算法训练的熔炉。

整个过程涉及数十个环节。

困扰当今自动驾驶发展的核心问题也源于此。

一是随着大部分常规问题的解决，有效数据的收集越来越困难；二是随着数据规模的增大，数据处理的成本也越来越高。

图为自动驾驶训练流程。

首先是数据收集问题。

当自动驾驶进入最后0.5%的极端情况阶段时，现实世界中的场景数据就变得很难获取。

为了应对这些问题，特斯拉、Waymo、Cruise 等公司正在不同程度地使用合成数据来模拟现实世界来训练自动驾驶。

然而，这种方法也有一些缺点。

例如，虽然合成数据可以轻松生成大量数据，但它可以增加自动驾驶训练数据的多样性。

但作为人工生成的数据，合成数据无法完全模拟现实世界的复杂性和变化。

过度使用合成数据会导致自动驾驶中出现“纸上谈兵”的现象，即在训练时表现良好，但一旦上路就失败了。

这种情况称为过拟合。

对于此类问题，大型模型提供了新的解决方案。

比如利用大模型进行数据生成的技术——迁移生成。

它可以根据真实场景快速生成不同时间、不同环境的情况。

例如，拍摄一张春天的街道，大模型可以快速生成街道在雨、风、雪等不同条件和季节下的情况。

这样做的好处是“可控” ”。

自动驾驶训练可以根据一些特定的需求生成一些特定的场景，更重要的是这些场景包含一些真实的数据，这样不仅增加了训练场景的丰富性，还可以避免过拟合。

目前，一些厂家正在逐步尝试。

飞墨CEO顾伟豪在AI Day上提到了这项技术。

清华智能产业研究院（AIR）提出的自动驾驶模型也有类似的设置。

在他们的设置中，模型会建议如何获取不同的数据，包括真实数据和模拟数据。

这些数据然后通过受控管道进行清洗，再经过感知和决策两大模型，最终为车辆提供决策。

二是数据标注。

数据标注不是一次性完成的。

同一张照片，在不同的时期，根据需要解决的问题，需要标注的东西也不同。

例如，如果一开始就需要解决车辆识别的问题，那么照片中突出显示的车辆就会有所不同。

后面如果要解决红绿灯识别的问题，那么高亮的可能就是红绿灯。

总之，数据标注是一个迭代、逐步细化的过程，因此难度和成本不断增加。

在国外，特斯拉率先推出自动数据标注，让原本需要几个月的工作在几周内完成。

2016 年 6 月，由于效率的提高，特斯拉解雇了位于加利福尼亚州圣马特奥办公室的大部分数据标签人员。

特斯拉之后，国内自动驾驶企业也开始跟进，并将自动标注运用到日常训练中。

作为特斯拉的“中国徒弟”，顾伟豪介绍了海默利用大型模型进行数据标注的案例。

它利用大语言模型和多模态能力来匹配跨文本和文本特征，然后将其放入大语言模型中以在特征空间中形成的目标搜索（查询）特征。

在此基础上，大模型可以将之前没有标记过的内容标记出来，想要标记出来，不需要太多的准备。

总体而言，大型模型的访问优化了自动驾驶的训练过程。

如果把训练自动驾驶算法比作建造金字塔，那么大型模型的加入就像用现代起重机取代了曾经由人力堆砌的石头，加速了自动驾驶的“建造”进程。

02 大模型让自动驾驶“长大脑” 在自动驾驶训练中，大模型就像专职助手，不断提高算法训练的效率。

但这只是工程优化。

大型车型给自动驾驶带来更深层次的改变。

这个问题可以追溯到自动驾驶的工作原理。

在大型模型出现之前，自动驾驶是任务驱动的。

也就是程序员根据一些具体场景编写一些解决方案代码。

当车辆在行驶过程中感知到相应的情况时，就会按照之前设定的方法进行处理。

在此基础上，自动驾驶的发展就变成：发现一个问题，收集一些数据，然后训练一个小模型来解决问题，然后发现新的问题，等等。

但这种模式在解决问题上存在一定的滞后性，即必须先发现问题，然后等待一段时间才能解决。

第二个是泛化问题，即夏天解决的同样问题，冬天不一定能解决。

也正因为如此，自动驾驶有无穷无尽的极端情况需要解决。

这些问题实际上都指向传统自动驾驶算法的“脚本化”工作模式，并没有真正认识和理解世界，即自动驾驶没有灵魂。

大型模型的出现为解决这一问题提供了方向。

就像大模型让虚拟人和语音助手长“大脑”一样，大模型也让自动驾驶长“大脑”。

特斯拉提出的“端到端”技术也被称为“感知与决策一体化”，意思是“感知”和“决策”集成为一个模型，直接发出指令并控制车辆。

这样，输入传感器信号后，就可以直接控制车辆。

输出车辆控制信号大大降低了级联错误的概率，从而大大提高了系统性能的上限，整体潜力巨大。

来源：马斯克推特目前，中国还未能实现真正的“端到端”。

比如海默DriveGPT依然分为感知大模型和认知大模型两部分。

大感知模型除了根据车辆输入的信号进行三维重建外，还需要添加时间特征以形成四维空间。

在此基础上，海默推出了大型多式联运模式。

多模态大模型已经做了很多文本和对齐工作。

这时，通过将其与4D语义空间对齐，我们就可以捕获自动驾驶传感器所看到的所有事物。

语义化，从而形成识别万物的普遍能力。

有了这个能力，结合认知大模型，可以结合驾驶过程中的信息和驾驶目标，如直行、变道、左转等，给出相应的驾驶决策和驾驶解释，然后大模型将其转换为自动驾驶的语言，并通过Drive Prompt与自动驾驶系统进行交互。

本质上，大模型就像自动驾驶的“导航员”和“翻译员”。

它理解驾驶的目标和意图，识别和感知环境，然后做出决策并将其翻译成自动驾驶的语言。

自动驾驶系统发出适当的指令。

当然，从人类的角度来看，驾驶车辆的过程不仅需要识别一切，还需要预测环境中所有物体的运动方向，以便我们在面对复杂的交通环境时能够提前做出反应。

大型车型也给自动驾驶带来了这方面的改进。

2016年，特斯拉在年底的AI Day上提出了名为“交互搜索”的规划模型。

它主要由树搜索、神经网络轨迹规划和轨迹评分三部分组成，可以有效地预测道路交通参与者。

行为轨迹。

由此可见，自动驾驶决策已经从依赖单一信息进行分布式决策，转变为基于多类信息聚合的统一决策。

自动驾驶的决策路径，即大模型的决策越来越像一个整体。

目前生成未来世界的技术可以根据当前的视频和图片生成未来2到5秒的情况。

2秒后预测准确率达到85%，这使得AI可以对未来做出一些预测。

同时，未来预测技术还可以运用到自动驾驶训练中。

比如可以生成未来图片，然后根据真实图片进行自监督学习，生成未来图片，提高整个视觉大模型识别的判断力。

能力。

它让自动驾驶越来越成为一个“整体”。

正如清华大学智能产业研究院院长张亚勤所言，“人工智能大模型带来了从判别式人工智能到生成式人工智能的新的技术范式转变。

自动驾驶达到安全可靠的最后阶段是必须实现的。

”以端到端的方式。

” 03 自动驾驶底层已演化为“整体”。

自动驾驶方面对此的讨论实际上并不是在大型车型流行之后才开始的。

2009年，当有关自动驾驶的讨论还集中在芯片和电子电气架构时，全球知名汽车零部件供应商博世就提出汽车电子电气架构将从分布式向域集中式、中央计算过渡。

早期的汽车电子电气架构主要基于ECU（Electronic Control Unit）。

一辆汽车通常有30到30个ECU，分别控制汽车的发动机、变速箱、制动等功能。

随着汽车智能化的进步，具有相关功能的ECU逐渐集成到域控制器中。

目前，智能汽车通常有五个领域：动力域、底盘域、车身域、座舱域和自动驾驶域。

在此基础上，智能汽车的电气架构仍在向“整体”演化，最终将形成由统一中央计算单元控制的形态。

2016年，特斯拉发布的Model 3实现了中央域控架构的雏形。

当时被业界认为在电子电气架构方面领先传统车企6年以上。

从“批量”到“整体”，这是智能汽车硬件层面的变化。

这一变化也推动自动驾驶软件发展成“整体”，机会就是大型车型。

对于自动驾驶和大型模型，张亚勤提到，“自动驾驶不是一个模型，而是多个模型的组合。

”这实际上对应了智能汽车硬件域控制器的发展阶段。

这也是华为盘古大模型3.0的理念。

华为云EI服务产品部总监尤鹏认为，通过数智融合架构，可以打破数据和AI资源管理的边界，在一个平台上完成开发、测试、交付和在线工作，让业务创新效率提升2倍，实现数据加速；借助盘古大模型在认知、感知、决策、优化等各个领域的能力，车企可以基于盘古快速训练自己需要的模型，实现算法加速；同时，华为还提供底层升腾算力平台，解决自动驾驶对算力的高需求，实现数月不间断的1000卡路里训练，打通“全链路”，实现算力加速。

“全链路建模是3.0时代重要的进化思想，最终会演变成端到端的大模型。

”顾伟豪说道。

一旦全链路完成，这样的改变将会带来大规模、高速的迭代。

正是因为“端到端”的技术，马斯克曾表示“今年年底完全自动驾驶将成为可能”。

虽然这句话不排除马斯克在吹牛，但我们也能看到“端到端”技术的巨大潜力。

总的来说，对于自动驾驶来说，大模型并不是一种决策方式，也不仅仅指一种技术，而是自动驾驶发展的最终形态。

当然，虽然大型模型给自动驾驶的实施带来了巨大的想象空间，但实际应用和实施过程中仍然面临不少问题。

例如，最直接的问题是如何将大型云模型的能力应用到汽车上。

目前业界常用的方法有三种：第一种是将大模型提炼成小模型，应用到车辆端。

这个具体分为两条路线。

一是通过大模型对数据进行标注，监督小模型的学习；另一种是将大模型上的Feature map与小模型上的Feature map对齐，然后完成小模型。

模型能力的提高。

从美墨公布的工作效率来看，一个模型的升华需要几个月的时间，但可以帮助自动驾驶汽车模型将单项任务的感知指标提升5%。

二是通过云端的大模型构建出能力，然后通过减脂、蒸馏等方式，将大模型的能力提炼成汽车端的小模型，完成小模型在汽车端的进展。

车侧。

第三种方法是直接使用云大模型。

毕竟云传输虽然会面临信号、安全、延迟等问题，但并不意味着所有决策都需要车方完成。

云大模型具有更强的泛化和解释能力。

对于任务实时性和网络信号都好的地方，也可以让车辆和云大模型之间进行一些通信，然后让云大模型完成车辆端的工作。

案件。

除了将大模型应用到汽车上之外，大模型引导的自动驾驶还需要学习很多关于人类生活的常识。

比如是否可以朝路边的方向行走，以及面对多个路口时各个方向是否必须遵循车道线等。

大车型入侵自动驾驶

这些在实际交通实践中常规的东西是大型模型无法掌握的。

“现在，解决这些问题需要添加很多约束，而一旦添加了约束，系统就变得不智能。

”顾伟豪指出了逻辑悖论。

那么如何解决这些问题，如何发挥大型模型的优势，将成为未来自动驾驶的考验。

毕竟，目前大车型对自动驾驶带来的改变只是第一声枪响。

【本文经投资界合伙人Quadrant授权发布。

本平台仅提供信息存储服务。

】如有任何疑问，请联系投资界（）。

站长声明

标签：

上一篇：证监会：禁止从事房地产、主要从事金融投资业务的公司在科创板上市

下一篇：霸王、茶姬用“饭圈文化”收割年轻人？

恒力华振完成数千万元Pre-A轮融资，大辰创投领投

投资行业消息，据36氪报道，工业互联网公司恒力华振近日宣布完成数千万元融资Pre-A轮融资。本轮融资由大辰创投领投，明照资本跟投。据了解，本轮募集资金将主要用于产品研发及进一步商业落地。恒力华振成立于2007年，瞄准生产过程质量监控市场，为客户提供设备数字化、智能

06-17
CES 2023今日总结：实用主义重回主流，今年的PC性能大战即将打响

国际消费电子展（CES）作为年度首个科技展，于今日早早开幕。虽然今天还没有正式开始，但不少厂商已经迫不及待地拿出自己的美味佳肴让现场媒体抢先尝鲜。前面我们的记者还在路上。今天小编就给大家总结一下那些让人胃口大开的新品。英特尔算力领先，发布第13代全新处理器

06-21
首期5亿元，杭州零磁装备成果转化基金成立

投资界（ID：pedaily）消息，4月11日，环境科技创新平台创新生态系统暨环境科技创新平台动员大会杭州江南科学城建设举行。会上，举行了零磁装备成果转化基金设立签约仪式和环境科技创新平台创新生态联盟成立仪式。零磁装备成果转化基金首期规模5亿元。拟由杭州市科技创新集

06-17
富邦股份上市华工创投、江苏华工创业投资基金、天津博润和武汉高农生物创投获得退出

富邦股份上市。华工创投、江苏华工创业投资基金、天津博润、武汉高农生物创投退出。 2019年7月2日，湖北富邦科技股份有限公司在深圳创业板挂牌上市。湖北富邦科技有限公司成立于。湖北富邦科技有限公司是由湖北富邦化工科技有限公司整体变更设立的股份制公司。 2019年11月

06-17
图文视频之后，音频自媒体的未来

本文来自福布斯、作者和王每君。对播客未来的 10 个预测是两年前的今天写的。 2年前，荔枝FM还没有上线，小宇宙还没有上线，TME还没有官宣Director Audio，字节还没有推出番茄收听，网易还没有更新8.0版本的播客，没有底指南中，快手和百度尚未进入播客行业，微信音频尚未推

06-21
Snap It是一款减肥工具，可以通过拍照来计算食物卡路里

FitNow是一家位于波士顿的移动应用开发公司。他们推出了一款应用程序“Lose It”，可以用来追踪食物摄入量和运动量——它是今年苹果商店推出的首批应用程序之一。而且8年后，这款应用仍然是Apple Store和Android应用商店中排名第一的减肥健康应用。 FitNow 联合创始人兼首席

06-18
日托机构EarlyBird完成天使轮融资

据投资界5月21日消息，高端日托机构EarlyBird完成天使轮融资。投资方为万新集团和清河投资。公开资料显示，早鸟成立于2006年，是一家针对0-4岁婴幼儿的高端托育机构。公司为社区家庭提供ToC全日托、半日托等托儿服务；同时还根据企业个性化需求提供ToB服务。目前在北京设

06-18
米文动力获数千万元A+轮融资

据投资界6月3日消息，据36氪报道，米文动力近日宣布获得数千万元A+轮融资。本轮投资由北汽产业投资领投。赛智创投跟投。公司此前已获得云天使基金等天使轮投资，以及博彦嘉铭、硅谷资本中国等数千万元A轮投资，据了解，本轮资金将用于增加产品线、扩大产能、发展垂直行业

06-18
半导体投资2320亿，三星力压群雄

据报道，韩国三星电子2016年在芯片工厂和设备上的投资比台积电、英特尔等任何竞争对手都多。三星电子周三（9日）表示，已投资43.6万亿韩元（约合人民币1亿元）升级和扩建位于韩国和中国的芯片工厂。这些工厂生产先进的 DRAM 芯片和垂直 NAND 闪存芯片。资金也得到了补充。

06-08
这个看起来像软糖的7厘米小玩意实际上是模仿猎豹的“最快”软机器人，长

7厘米，重45克。它可以在陡坡上奔跑、在水中游泳、奔跑、跳跃、举起重物……而且它只是一个看起来像软糖的软体机器人。也许它最霸气的一面就是它模仿的猎豹。是的，它与追逐“糖蜜”的是同一种动物，但它也是陆地上速度最快的生物。软机器人看起来像这样。以“小猎豹”妖

06-18
马化腾陷入玻尿酸陷阱

作者｜徐明辉编辑｜柳儿源｜创作当年，由尤小刚执导，姜文、王姬主演的《北京人在纽约》热播。孔府佳酒邀请王姬担任品牌代言人。 “功夫甲酒让人思乡”的说法传遍大江南北。那是鲁九的辉煌时代。央视春晚的“王”大多是鲁九拿下的；中国白酒销量前十名中，绿酒占据四席。

06-17
搜狐视频的变化：并购和网络渠道合作可能是一个突破

闭关两年回来的张朝阳，发现自己找到了一份令人兴奋的工作。昨天，搜狐宣布，搜狐集团董事局主席张朝阳正式出任搜狐视频代理CEO。　　虽然这个消息在业内没有并购消息那么重要，但搜狐视频的人事变动还是引起了业界的震动：搜狐视频要努力了！　　张朝阳被任命为搜狐视频代

06-18