首页 > 科技未来 > 内容

大模特上车了,特斯拉带好了吗?

发布于:2024-06-18 编辑:匿名 来源:网络

,卡内基梅隆大学接到了美国军方的一个研究项目,内容涵盖了当时看来不可思议的自动驾驶。

为此,研究人员为一辆翻新的军用应急车配备了一个看起来像探照灯的巨大摄像头、一个冰箱大小的处理器和一个紫外线发生器。

尽管设备简陋、数据粗糙,例如据媒体报道,当时的车顶摄像头只能输入 30×32 像素的网格,但借助突破性的神经网络,名为“ALVINN”的自动驾驶汽车可以最高时速可达88公里/小时。

ALVINN被誉为自动驾驶领域的里程碑项目。

大模特上车了,特斯拉带好了吗?

其最深远的影响是用神经网络替代了人工编码,成为自动驾驶技术后续发展的灯塔。

在接下来的几十年里,自动驾驶技术沿着ALVINN的方向快速发展。

直到chatGPT的出现,大型模型登场,成为改变自动驾驶世界的变量。

在汽车方面,大型模型已经应用于自动驾驶的感知和预测,并正在向决策层渗透;在云端,大型模型为L3及以上自动驾驶的实现铺平了道路;甚至,大型车型将加速城市NOA的实施。

在全球下游企业中,特斯拉无疑是少数走在前列的企业之一。

今年8月,特斯拉的端到端AI自动驾驶系统FSD Beta V12版本公开亮相。

据称,它可以完全依靠车载摄像头和神经网络来识别道路和交通状况并做出相应的决策。

这种端到端模型的感知与决策一体化,使得自动驾驶可以直接从一端输入图像数据,从另一端输出操作控制,更加接近真实的人类驾驶。

然而,当车企努力向端到端模式靠拢时,却发现想要超越,必须先跟随。

01 算法第一 让大模型上路,特斯拉*是最激进的一个。

早在2009年,特斯拉就开始布局自动驾驶软硬件自研,并于2012年陆续实现算法和芯片自研。

随后在2016年,特斯拉的自动驾驶迎来了大规模升级:不仅将Mobileye的Autopilot 3.0替换为FSD Beta,算法也从原来的2D+CNN升级为BEV+Transform。

Transformer 就是 GPT 中的 T。

它是一个深度学习神经网络。

其优点是可以实现全局理解的特征提取,增强模型的稳定性和泛化能力。

BEV的全称是Bird’s Eye View,是一种将三维环境信息投影到二维平面上,以鸟瞰的方式显示环境中的物体和地形的方法。

与传统小车型相比,BEV+Transformer提高了智能驾驶的感知和泛化能力,有助于缓解智能驾驶的长尾问题:1)感知能力:BEV具有统一视角,融合了激光雷达、雷达和摄像头的融合将多模态数据集中到同一平面上可以提供全局视角并消除数据之间的遮挡和重叠问题,提高目标检测和跟踪的准确性; 2)泛化能力:Transformer模型可以实现全局理解的特征提取,有利于发现事物本身的内在联系,让智能驾驶能够学会总结而不是机械学习。

2016年,特斯拉在算法中引入了顺序网络,并将BEV升级为Occupancy Network,有效解决了从三维到二维过程中的信息丢失问题。

从感知算法的进展情况来看,今年及之前业界整体商业应用以2D+CNN算法为主。

随着ChatGPT等大型AI模型的兴起,算法升级为BEV+Transformer。

从时间上来说,特斯拉具有*优势(年)。

国内小鹏、华为、理想等今年才改用纯电动+变压器。

但无论是特斯拉还是国内整车厂,BEV+Transformer仍然只用在传感侧。

虽然学术界以最终规划为目标,提出了感知与决策一体化的通用大规模智能驾驶模型UniAD+全栈Transformer模型,但由于算法复杂+算力要求大,实现目标尚无准确的时间表。

02 算力竞争 2002年,因涉及辅助驾驶的致命事故而与Mobileye分道扬镳的特斯拉找到NVIDIA定制算力达24TOPS的计算平台Drive PX2,拉开了车企疯狂追捧的神奇序幕的计算能力。

继Drive PX2之后,英伟达在六年内发布了三代智能驾驶芯片,从Xavier到Orin再到Thor。

算力从30TOPS跃升至TOPS,增长了83倍,比摩尔定律还要快。

上游算力的“疯狂”积累,归根到底是因为下游有人买单。

一方面,随着智能汽车上传感器的规格和数量的增加,数据水平猛增。

以特斯拉Model Y和小鹏G6 Max为例。

后者需要的计算能力是前者的3.5倍,因为它配备了更多的传感器。

当自动驾驶汽车每天可以产生数TB甚至数十TB的数据时,数据处理能力是验证自动驾驶技术的关键点之一。

另一方面,“大建模”也使得智能驾驶算法的芯片算力日益紧张。

上汽人工智能实验室测试显示,仅需10 Tops以内的算力即可实现L2级自动驾驶,实现L4级自动驾驶只需约Tops左右的算力。

下游企业对算力需求暴涨其实还有其他原因。

一是云计算能力。

自动驾驶系统的早期和后期发展都依赖于大量的环境数据输入来训练和验证算法。

同时,模拟测试时的场景构建和渲染也需要较高的计算能力支持。

而且,特斯拉领导的神经网络Transformer也是资源消耗大户。

好墨智行数据显示,Transformer 在训练端需要的计算能力是 CNN 的两倍。

因此,下游企业想要获得算力,要么自己建设智能计算中心(特斯拉),要么与云服务商合作。

最糟糕的选择就是将算力全部外包,包括算法、计算资源、应用服务等。

虽然国内主流整车厂/自动驾驶厂商的智能计算中心已经全部上线,但由于自建成本较高,大部分国内主流自动驾驶厂商采取合作模式/采购模式。

例如,吉利星瑞和小鹏福耀都是由阿里云提供支持的。

、莫莫和理想都是火山发动机。

但从长期成本优势来看,自建倾向依然较高。

另一个是NOA。

现实中,主机厂搭载城市NOA高端智能驾驶功能的车型,大部分算力都在TOPS左右。

然而,在NOA从高速公路向城市道路(高速公路-城市快速路-城市主干道-城市次干路-城市支路)拓展的过程中,人流变得更加密集(每年只有25%的人通过高速公路出行)。

当天,而城市道路的道路环境复杂度越高,对物体识别、感知融合和系统决策的算力要求就越高,木希首席产品官孙国梁指出,要在上面部署大型模型。

汽车端要能够完成设定的任务,算力至少要达到~TOPS,模型优化可能会降低算力要求,但考虑到未来场景复杂度和数据量的增加,以及比例的增加。

视觉感知(相对于基于规则),车端算力或将翻倍至TOPS以上 03 感知升级 光大证券判断,三大要素重要性顺序从L2/L2+走向L3高。

高端智能驾驶是数据>算法>硬件,后期向更高端智能驾驶迈进的顺序可能是硬件>=算法>数据。

理论依据是,实现L3智能驾驶的关键在于综合感知,主要依靠海量+长尾场景数据来驱动算法升级和优化;其中,需要低线城市数据覆盖非成像场景(对比目前车载算力基本足够L3-L4级别要求)。

现阶段,海量+长尾场景数据的获取依赖于车载传感器(摄像头)的大幅升级。

根据 Yole 的报告,自动驾驶 L1-L3 所需的摄像头数量增加了一倍。

例如,L1-L2只需要前后两个摄像头,L3则需要20个摄像头。

事实上,主机厂为后续OTA升级预留了冗余,而自行车的摄像头配置远远超过了该级别所需的摄像头数量。

例如特斯拉Model 3配备9个摄像头,蔚来、小鹏、理想车型则配备10-13个摄像头。

此外,由于大型模型对传感数据的精细化要求,深度学习模型中高分辨率图像数据可以作为更新和优化其架构参数的数据源,特别是前视摄像头,需要解决最多场景和目标识别任务。

最复杂的,比如远距离小目标识别和短距离目标切入识别。

为了识别和监控更远距离的目标,车载摄像头必须升级到百万像素或更高。

典型的例子是百度Apollo,它与索尼、联创、黑芝麻智能联手打造了全球首款超百万像素车载摄像头模组。

在提升感知能力方面,有两个障碍是所有车企都想回避的,即高精度地图和激光雷达。

高精度地图作为先验信息,可以为自动驾驶提供大量的安全冗余。

在数据和算法成熟之前,主机厂对它们的依赖程度很高。

地图下架的原因相对容易理解:1)高精度地图存在更新周期长、成本高、地图经销商资质收紧等缺点,限制了高端自主大规模商业化的可能性驾驶。

2)构建数据闭环,形成算法模型的迭代升级并反馈给车端。

至于如何摆脱地图,特斯拉的做法是引入车道线网络和新的数据标注方法。

国内领先的自动驾驶公司采用车端实时地图解决方案,利用安装在车辆上的摄像头等传感器构建车辆行驶过程的地图。

周边环境地图。

目前,小鹏、华为等领先整车厂均已发布无高精度地图的高端智能驾驶解决方案,并制定了量产时间表。

华为、好墨、圆融七星等自动驾驶公司也纷纷加入,自动驾驶算法“重要”。

“感知、光图”趋势明显。

激光雷达是由于成本问题。

激光雷达在距离和空间信息方面具有精度优势。

搭载激光雷达的多传感器融合感知解决方案,可以通过互补实现全环境感知能力,为高级别自动驾驶提供安全冗余。

但激光雷达确实是一个成本大的玩家。

早些年,除了特斯拉之外,几乎所有成熟的无人驾驶技术方案都采用了64位激光雷达。

其造价约为70万元,一个小雷达抵得上一辆车。

甚至几辆车。

特斯拉利用占领网络来实现类似于激光雷达的传感效果。

由于缺乏机器视觉算法,预计国内整车厂仍将使用激光雷达作为重要的补充传感器,这可以减少视觉领域需要积累的数据量。

此外,4D成像毫米波雷达可能完全取代3D毫米波雷达,并有望取代低线激光雷达。

与激光雷达相比,4D成像毫米波雷达的部分指标接近16线激光雷达的性能,但成本仅为激光雷达的十分之一。

基于全新自动驾驶硬件HW4.0,特斯拉首次为S/X车型配备了4D毫米波雷达。

除特斯拉外,40万元以下的理想车型、70万元以上的宝马车型、通用汽车收购的Cruise自动驾驶服务车近两年都完成了4D毫米波雷达的布局。

与此同时,大陆、采埃孚等汽车一级巨头也基本完成了在该领域的布局。

04 尾声 8月,马斯克亲自启动了FSD Beta V12的现场试驾。

在45分钟内,FSD Beta V12系统在整个驾驶过程中进展非常顺利,能够轻松绕过障碍物并识别各种路标。

马斯克兴奋地说:V12系统自始至终都是通过AI实现的。

我们没有编程,没有程序员写一行代码来识别道路、行人等,这一切都交给了神经网络。

而这一切都是建立在海量的“视频数据”和一万个H的基础上的。

遗憾的是,这两项战略资源并不是国内主机厂能够轻易赶上的。

【本文由投资社区合作伙伴微信公众号授权:解码。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

大模特上车了,特斯拉带好了吗?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 茅台开始卖鸡尾酒,邀请周杰伦代言

    茅台开始卖鸡尾酒,邀请周杰伦代言

    酱拿铁推出两个多月后,贵州茅台宣布推出鸡尾酒,并邀请周杰伦代言。 11月20日,茅台生态农业公司与传祺啤酒共同研发的“贵州味道”系列鸡尾酒正式发布。 发布会上,Mochito品牌代言人周杰伦还用视频宣传了MOJT鸡尾酒“贵州味”系列新品。 据茅台时空介绍,本次新品发布会推

    06-18

  • 有消息称Facebook可能在5月下旬启动IPO,并于下个月提交申请

    有消息称Facebook可能在5月下旬启动IPO,并于下个月提交申请

    北京时间1月16日晚间消息,据外媒援引人士知情人士言论称,Facebook可能启动IPO今年5月第三周(首次公开披露招股说明书)。   这意味着Facebook必须在下个月内提交IPO申请文件,因为美国证券交易委员会(SEC)通常需要3到4个月的时间来审核。 而且,这是在相当顺利的情况下

    06-17

  • 适用于 50V FM 无线电广播应用的高效 1,600W 极其坚固耐用的射频功率晶体管

    适用于 50V FM 无线电广播应用的高效 1,600W 极其坚固耐用的射频功率晶体管

    荷兰奈梅亨 - Ampleon Semiconductor () 宣布推出适用于 88 广播 FM 无线电应用的高功率坚固型 BLFXRA RF 功率晶体管在 MHz 频率范围内。 BLFXRA 由行业标准 50V 电源供电,输出功率超过 1 W (CW)。 该晶体管具有一流的工作功率效率 (82%),这种“绿色”凭证有助于提供环保性

    06-06

  • 5G、物联网、自动驾驶,这家公司在这些领域都有存在

    5G、物联网、自动驾驶,这家公司在这些领域都有存在

    高通成立于2008年,现在业务涉及人们生活的方方面面,包括智能手机、集成电路、物联网、大数据、软件高通涉足汽车、汽车等领域。 他们的基础技术不断进步,让无数硬件厂商在此基础上打造出更多消费者和行业从业者喜爱使用的产品。 因此,5月21-22日两天,高通在水立方举办了高

    06-21

  • 合川医疗完成数千万元A轮融资,启明创投独家投资

    合川医疗完成数千万元A轮融资,启明创投独家投资

    7月12日消息,深圳市合川医疗科技有限公司(以下简称“合川医疗”)近期完成数十轮融资数百万人民币A轮融资。 启明创投独家投资。 本轮融资将用于加速公司在国际、国内市场的CDMO业务拓展,以及新技术、生产工艺的开发和产能的扩张。 合川医疗成立于2006年,主要为客户提供微

    06-18

  • 北京出台支持创新型中小企业在北交所上市8项措施

    北京出台支持创新型中小企业在北交所上市8项措施

    有关单位和机构:加大对企业在北交所上市的政策服务保障,促进创新型中小企业在北交所上市本市中小企业高质量发展,支持北交所打造服务创新型中小企业主阵地,加快建设国际科技创新中心和世界领先的科创中心科技园区、市科委、中关村管委会、市金融监管局制定《关于支持创新型

    06-17

  • 清华大学“携手”华为签署科技合作框架协议

    清华大学“携手”华为签署科技合作框架协议

    近日,华为与清华大学签署科技合作框架协议。 双方将共同在核心关键技术领域进行5至10年的长期研究,产生领先的创新成果。 研究成果。 6月3日,华为技术有限公司(以下简称“华为公司”)董事、战略研究院院长徐文伟一行访问清华大学。 双方签署科技合作框架协议。 据介绍,

    06-06

  • 贵州茅台一季度净利润增长个位数,两家公司持有的私募股权数量保持不变

    贵州茅台一季度净利润增长个位数,两家公司持有的私募股权数量保持不变

    昨天晚间,贵州茅台披露了今年一季度报告,显示公司经营情况一季度收入7100万元,同比增长11.74%;净利。 54亿元,同比增长6.57%。 纵观贵州茅台一季报前十大流通股东名单,有两家私募公司各占一席,且两者持股数量较去年底没有变化。

    06-17

  • 加特兰完成数亿元C轮融资

    加特兰完成数亿元C轮融资

    据投资界(ID:pedaily)9月8日消息,近日,加特兰微电子科技(上海)有限公司(以下简称“加特兰”) ”),一家CMOS工艺毫米波雷达芯片设计厂商完成数亿元人民币C轮融资。 本轮融资由国投投资领投,朗玛峰创投、交银国际跟投。 华兴资本旗下华兴新经济基金持续加大投资力度

    06-18

  • P2P学习到底是什么? 42想在硅谷免费批量培训码农

    P2P学习到底是什么? 42想在硅谷免费批量培训码农

    据Techcrunch报道,一所名为42的法国私立编程学校最近在硅谷开办了。 其创始人Xavier尼尔表示将在硅谷“免费培养0个码农”。 呵呵?我们来看看:学校的由来。 42学校的名字取自英国科幻小说《银河系漫游指南》。 42是生命、宇宙和所有问题的终极答案。 42 该公司于 2006 年由

    06-17

  • 免费注释还可以“连接一切”,你可以取消你的Instapaper订阅

    免费注释还可以“连接一切”,你可以取消你的Instapaper订阅

    我们每天醒来都会看到很多许多多的新文章,而真正有用的内容可能只占内容的一小部分。 显然没有必要把每一篇文章都转储。 如果你只是复制并粘贴相关内容而忽略上下文,你很快就会忘记为什么你有这样的感觉。 那么,有妥协的办法吗?当然!今天我们要介绍的网页标注服务——Hy

    06-21

  • 楠火锅负责人做客美团直播间, 11月线上交易额同比增长45%

    楠火锅负责人做客美团直播间, 11月线上交易额同比增长45%

    来自北京的唐女士一家元旦探访首都太古里,来到春熙路东下街的南火锅吃饭。 。 这家装修复古的火锅店让唐女士惊叹不已。 “这是正宗的重庆味道,值得排队一个小时。 ”南火锅早在2017年就“一夜成名”,连续多年稳居成都、重庆等地区大众点评人气榜前三名。 年底,南火锅在大

    06-17