首页 > 科技未来 > 内容

随着大车型上路,特斯拉是否取得了良好的领先优势?

发布于:2024-06-18 编辑:匿名 来源:网络

,卡内基梅隆大学接到了美国军方的一个研究项目,内容涵盖了当时看来不可思议的自动驾驶。

为此,研究人员为一辆翻新的军用应急车配备了一个看起来像探照灯的巨大摄像头、一个冰箱大小的处理器和一个紫外线发生器。

尽管设备简陋、数据粗糙,例如据媒体报道,当时的车顶摄像头只能输入 30×32 像素的网格,但借助突破性的神经网络,名为 ALVINN 的自动驾驶汽车可以最高时速可达88公里/小时。

ALVINN被誉为自动驾驶领域的里程碑项目。

其最深远的影响是用神经网络替代了人工编码,成为自动驾驶技术后续发展的灯塔。

在接下来的几十年里,自动驾驶技术沿着ALVINN的方向快速发展。

直到chatGPT的出现,大型模型登场,成为改变自动驾驶*的变量。

在汽车方面,大型模型已经应用于自动驾驶的感知和预测,并正在向决策层渗透;在云端,大型模型为L3及以上自动驾驶的实现铺平了道路;甚至,大型车型将加速城市NOA的实施。

在全球下游企业中,特斯拉无疑是少数走在前列的企业之一。

今年8月,特斯拉端到端AI自动驾驶系统FSD Beta V12版本公开亮相。

据称,它可以完全依靠车载摄像头和神经网络来识别道路和交通状况并做出相应的决策。

这种端到端模型的感知与决策一体化,使得自动驾驶可以直接从一端输入图像数据,从另一端输出操作控制,更加接近真实的人类驾驶。

然而,当车企努力向端到端模式靠拢时,却发现想要超越,必须先跟随。

01 算法优先 特斯拉* 是最激进地将大型车型放入汽车中的算法。

早在2009年,特斯拉就开始开展自动驾驶软硬件自研,并于2016年陆续实现算法和芯片自研。

随后在2019年,特斯拉的自动驾驶迎来了大规模升级:不仅将Mobileye的Autopilot 3.0换成了FSD Beta,算法也从原来的2D+CNN升级为BEV+Transform。

Transformer 就是 GPT 中的 T。

它是一个深度学习神经网络。

其优点是可以实现全局理解的特征提取,增强模型的稳定性和泛化能力。

BEV的全称是Bird’s Eye View,是一种将三维环境信息投影到二维平面上,以鸟瞰的方式显示环境中的物体和地形的方法。

与传统小车型相比,BEV+Transformer提高了智能驾驶的感知和泛化能力,有助于缓解智能驾驶的长尾问题:1)感知能力:BEV具有统一视角,融合了激光雷达、雷达和摄像头的融合将多模态数据集中到同一平面上可以提供全局视角并消除数据之间的遮挡和重叠问题,提高目标检测和跟踪的准确性; 2)泛化能力:Transformer模型可以实现全局理解的特征提取,有利于发现事物本身的内在联系,让智能驾驶能够学会总结而不是机械学习。

2016年,特斯拉在算法中引入了顺序网络,并将BEV升级为Occupancy Network,有效解决了从三维到二维过程中的信息丢失问题。

从感知算法的进展情况来看,今年及之前业界整体商业应用以2D+CNN算法为主。

随着ChatGPT等大型AI模型的兴起,算法升级为BEV+Transformer。

从时间上来说,特斯拉具有*优势(年)。

国内小鹏、华为、理想等今年才改用纯电动+变压器。

但无论是特斯拉还是国内整车厂,BEV+Transformer仍然只用在传感端。

虽然学术界以最终规划为目标,提出了感知与决策一体化的通用大规模智能驾驶模型UniAD+全栈Transformer模型,但由于算法复杂+算力要求大,实现目标尚无准确的时间表。

02 算力竞争 2002年,特斯拉和Mobileye因涉及辅助驾驶的致命事故分道扬镳。

他们找到NVIDIA定制了计算能力达到24TOPS的计算平台Drive PX2,拉开了车企疯狂追求计算能力的神奇序幕。

继Drive PX2之后,英伟达在六年内发布了三代智能驾驶芯片,从Xavier到Orin再到Thor。

算力从30TOPS跃升至TOPS,增长了83倍,比摩尔定律还要快。

上游算力的“疯狂”积累,归根到底是因为下游有人买单。

一方面,随着智能汽车上传感器的规格和数量的增加,数据水平猛增。

以特斯拉 Model Y 和小鹏 G6 Max 为例,后者由于配备了更多传感器,需要的计算能力是前者的 3.5 倍。

当自动驾驶汽车每天可以产生数TB甚至数十TB的数据时,数据处理能力是验证自动驾驶技术的关键点之一。

另一方面,“大建模”也使得智能驾驶算法的芯片算力日益紧张。

上汽人工智能实验室测试显示,仅需10 Tops以内的算力即可实现L2级自动驾驶,实现L4级自动驾驶只需约Tops左右的算力。

下游企业对算力需求暴涨其实还有其他原因。

一是云计算能力。

自动驾驶系统的早期和后期发展都依赖于大量的环境数据输入来训练和验证算法。

同时,模拟测试时的场景构建和渲染也需要较高的计算能力支持。

而且,以特斯拉为首的神经网络Transformer也是一个资源消耗大户。

好墨智行数据显示,Transformer在训练端需要两倍于CNN的算力。

因此,下游企业想要获得算力,要么自己建设智能计算中心(特斯拉),要么与云服务商合作。

最糟糕的选择就是将算力全部外包,包括算法、计算资源、应用服务等。

虽然国内主流整车厂/自动驾驶厂商的智能计算中心已经全部上线,但由于自建成本较高,大部分国内主流自动驾驶厂商采取合作模式/采购模式。

例如,吉利星瑞和小鹏福耀都是由阿里云提供支持的。

、莫莫和理想都是火山发动机。

但从长期成本优势来看,自建倾向依然较高。

另一个是NOA。

现实中,主机厂搭载城市NOA高端智能驾驶功能的车型,大部分算力都在TOPS左右。

然而,在NOA从高速公路向城市道路(高速公路-城市快速路-城市主干道-城市次干路-城市支路)拓展的过程中,人流变得更加密集(每年只有25%的人通过高速公路出行)。

当天,而城市道路的道路环境复杂度越高,对物体识别、感知融合和系统决策的算力要求就越高,木希首席产品官孙国梁指出,要在上面部署大型模型。

汽车端要能够完成设定的任务,算力至少要达到~TOPS,模型优化可能会降低算力要求,但考虑到未来场景复杂度和数据量的增加,以及比例的增加。

视觉感知(相对于基于规则),车端算力或将翻倍至TOPS以上 03 感知升级 光大证券判断,三大要素重要性顺序从L2/L2+走向L3高。

高端智能驾驶是数据>算法>硬件,后期向更高端智能驾驶迈进的顺序可能是硬件>=算法>数据。

理论依据是,实现L3智能驾驶的关键在于综合感知,主要依靠海量+长尾场景数据来驱动算法升级和优化;其中,需要低线城市数据覆盖非成像场景(对比目前车载算力基本足够L3-L4级别要求)。

现阶段,海量+长尾场景数据的获取依赖于车载传感器(摄像头)的大幅升级。

根据 Yole 的报告,自动驾驶 L1-L3 所需的摄像头数量增加了一倍。

例如,L1-L2只需要前后两个摄像头,L3则需要20个摄像头。

事实上,主机厂为后续OTA升级预留了冗余,而自行车的摄像头配置远远超过了该级别所需的摄像头数量。

例如,特斯拉Model 3配备9颗摄像头,蔚来、小鹏、力高等车型则达到10-13颗。

此外,由于大型模型对传感数据的精细化要求,深度学习模型中高分辨率图像数据可以作为更新和优化其架构参数的数据源,特别是前视摄像头,需要解决最多场景和目标识别任务。

最复杂的,比如远距离小目标识别和短距离目标切入识别。

为了识别和监控更远距离的目标,车载摄像头必须升级到百万像素或更高。

典型的例子是百度Apollo,它与索尼、联创、黑芝麻智能联手打造了全球首款超百万像素车载摄像头模组。

在提升感知能力方面,有两个障碍是所有车企都想回避的,即高精度地图和激光雷达。

高精度地图作为先验信息,可以为自动驾驶提供大量的安全冗余。

在数据和算法成熟之前,主机厂对它们的依赖程度很高。

地图下架的原因相对容易理解:1)高精度地图存在更新周期长、成本高、地图经销商资质收紧等缺点,限制了高端自主大规模商业化的可能性驾驶。

2)构建数据闭环,形成算法模型的迭代升级并反馈给车端。

至于如何摆脱地图,特斯拉的做法是引入车道线网络和新的数据标注方法。

国内领先的自动驾驶公司采用车端实时地图解决方案,通过安装在车辆上的摄像头等传感器来构建车辆驾驶。

过程周围环境的地图。

目前,小鹏、华为等领先整车厂均已发布无高精度地图的高端智能驾驶解决方案,并制定了量产时间表。

华为、好墨、圆融七星等自动驾驶公司也纷纷加入,自动驾驶算法“重要”。

“感知、光图”趋势明显。

激光雷达是由于成本问题。

激光雷达在距离和空间信息方面具有精度优势。

搭载激光雷达的多传感器融合感知解决方案,可以通过互补实现全环境感知能力,为高级别自动驾驶提供安全冗余。

但激光雷达确实是一个成本很高的玩家。

早些年,除了特斯拉之外,几乎所有成熟的无人驾驶技术方案都采用了64位激光雷达。

其成本约为70万元人民币。

一个小型雷达的价值相当于一辆汽车甚至几辆汽车。

特斯拉利用占用网络来实现类似激光雷达的传感效果。

由于缺乏机器视觉算法,预计国内整车厂仍将使用激光雷达作为重要的补充传感器,这可以减少视觉领域需要积累的数据量。

此外,4D成像毫米波雷达可能完全取代3D毫米波雷达,并有望取代低线激光雷达。

与激光雷达相比,4D成像毫米波雷达的部分指标接近16线激光雷达的性能,但成本仅为激光雷达的十分之一。

随着大车型上路,特斯拉是否取得了良好的领先优势?

基于全新自动驾驶硬件HW4.0,特斯拉首次在S/X车型上搭载4D毫米波雷达。

除特斯拉外,40万元以下的理想车型、70万元以上的宝马车型以及通用汽车收购的Cruise自动驾驶服务车近两年都完成了4D毫米波雷达的布局。

与此同时,大陆、采埃孚等汽车一级巨头也基本完成了在该领域的布局。

04 尾声 8月,马斯克亲自启动了FSD Beta V12的现场试驾。

在45分钟内,FSD Beta V12系统在整个驾驶过程中进展非常顺利,能够轻松绕过障碍物并识别各种路标。

马斯克兴奋地说:V12系统自始至终都是通过AI实现的。

我们没有编程,没有程序员写一行代码来识别道路、行人等,这一切都交给了神经网络。

而这一切都是建立在海量的“视频数据”和一万个H的基础上的。

遗憾的是,这两项战略资源并不是国内主机厂能够轻易赶上的。

【本文由投资社区合作伙伴微信公众号授权:解码。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

随着大车型上路,特斯拉是否取得了良好的领先优势?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 本周趣事:5万小牛在路上奔跑,“新车”增色瘦身

    本周趣事:5万小牛在路上奔跑,“新车”增色瘦身

    4月17日至23日,本周Top 5新品值得关注。 1、小牛M1电动摩托车自去年6月发布小牛电动N1以来,牛电科技于4月20日下午正式发布小牛M1系列四款新品,包括M1顶配版、M1动力版、M1都市版版本。 M1青春版(包括白、灰、红、黄、蓝五种颜色)。 售价分别为元、元、元、元。 据小牛电

    06-18

  • 本魔科技张笛:也许有一天我们可以直接驱动世界

    本魔科技张笛:也许有一天我们可以直接驱动世界

    作者|宫雪编辑|郑玄本末科技创始人张笛从小就是那种“别人家的孩子”。 用导师李泽湘的话来说,张笛在香港科技大学读书时就是一个“骗子”——他鼓捣出一套航天姿态控制器,最后把产品和技术打包卖掉。 到一家卫星公司,赚了几十万元。 对于大多数人来说,学生时期能够通过自

    06-18

  • 绿网完成1.5亿元B轮融资

    绿网完成1.5亿元B轮融资

    据投资界7月14日消息,武汉绿网信息服务公司(以下简称:绿网)近日完成1.5亿元B轮融资,投资方为国投创业投资。 本轮资金将用于深度消息检测领域的研发创新,助力国家信息安全产业。 资料显示,武汉绿网成立于2006年,是一家位于东湖高新区的高新技术企业。 为运营商及其他政

    06-17

  • 百度视频获1亿美元B轮融资,百度领投,经凯资本、厚泽如意、国金基金等跟投,

    百度视频获1亿美元B轮融资,百度领投,经凯资本、厚泽如意、国金基金等跟投,

    据投资界9月5日消息,百度视频近期完成B轮融资,由百度投资领投,其他主要投资方包括经开资本、厚泽如意、国金基金等投资机构,总投资1亿美元。   据透露,本轮融资后,百度视频将进一步加大在内容制作、内容投资以及人工智能等前沿技术研发方面的投入。   此前,百度视频

    06-18

  • 火多多获百万级天使轮融资

    火多多获百万级天使轮融资

    据投资界4月30日消息,据36氪报道,灵活就业解决方案服务商火多多近日获得中才资本、火山石资本投资,社宝科技.数百万元天使轮投资。 霍多多创立于2000年,创始人、胡胜曾就职于中国人才网、第一财经集团,并曾担任英格玛集团上海公司总经理。 火多多平台通过线上线下相结合

    06-18

  • 【创业24小时】2024年6月12日

    【创业24小时】2024年6月12日

    业界巨头公司董宇辉“抵制卖东西”2024年6月12日,东方精选股价持续下跌。 点击查看估值30亿美元,字节“养自己的儿子”,懂车的皇帝或“单飞”上市。 点击查看汇丰银行完成对花旗集团在华个人财富管理业务的收购。 点击查看当地生活。 不再模仿海底捞。 都在争当“火锅撒利亚

    06-18

  • 易居中国确认IPO发行价13.8美元,融资2亿美元

    易居中国确认IPO发行价13.8美元,融资2亿美元

    8月8日下午消息,国内首只房地产经纪概念股——易居中国(NYSE:EJ)今天确认IPO (首次公开发行)发行价格为13.8美元,超出此前11.5美元至13.5美元的发行价格区间。 易居中国定于今晚在纽约证券交易所挂牌上市,发行10,000股美国存托股票(ADS),募集资金2.01亿美元。   易

    06-18

  • Zynga将于今晚上市,继谷歌之后互联网行业最大规模IPO

    Zynga将于今晚上市,继谷歌之后互联网行业最大规模IPO

    北京时间12月16日早间消息,社交游戏开发商Zynga周四将IPO(首次公开发行)价格定为每股10美元,募集资金10亿美元,这是自谷歌上市以来美国互联网公司最大的IPO交易。   Zynga 将发行 1 亿股普通股,估值为 70 亿美元。 如果算上已发行股本和认沽权证,估值将达到89亿美元

    06-18

  • 上海超级国资平台正式诞生

    上海超级国资平台正式诞生

    投资界获悉,近日,上海国投公司与科创投资集团联合重组及领导班子调整公告会召开。 会议宣布上海国投公司与上海科技创业投资集团联合重组,任命袁国华为上海国投公司党委书记、董事长。 至此,上海一个超级国资平台诞生了。 在联合重组和领导班子调整宣布会上,上海市委常委

    06-18

  • 倍思科技完成数亿元A轮融资,深创投、中金资本联合领投

    倍思科技完成数亿元A轮融资,深创投、中金资本联合领投

    投资圈(ID:pedaily)4月21日消息,深圳市倍思科技有限公司(以下简称倍思科技)倍思科技(简称“倍思科技”)宣布完成数亿元A轮融资,本轮融资由深创投、中金资本联合领投,越秀产业基金、高榕资本跟投。 这是倍思科技自2006年成立以来首次进行外部市场融资,体现了资本市场

    06-18

  • 我的美元VC朋友转向氢能,崩溃了

    我的美元VC朋友转向氢能,崩溃了

    “我决定退出,转而去做咨询。 ”曾在北京一家美元风险投资基金工作的刘硕、投资经理决定辞职。 他已经在这个组织工作了三年,之前一直在TMT领域工作。 但今年年初,刘硕团队合伙人召开集体会议,叮嘱大家要抓住医疗产业升级的机遇,投资一批高端医疗器械独角兽。 这对刘硕来

    06-18

  • 潘建伟团队进行人类首次洲际量子通信

    潘建伟团队进行人类首次洲际量子通信

    undefined2017年,潘建伟团队宣布“墨子”一年内顺利完成三大科学目标:星地一公里诱骗态量子密钥分发;星地量子纠缠分布和千米距离贝尔态测量;传送。 这三个突破性实验是构建全球量子通信网络的基石。 结果证实,对于公里级的量子密钥分发,卫星链路效率比光纤高20多个数量

    06-06