首页 > 科技未来 > 内容

大模特上车了,特斯拉带好了吗?

发布于:2024-06-18 编辑:匿名 来源:网络

,卡内基梅隆大学接到了美国军方的一个研究项目,内容涵盖了当时看来不可思议的自动驾驶。

为此,研究人员为一辆翻新的军用应急车配备了一个看起来像探照灯的巨大摄像头、一个冰箱大小的处理器和一个紫外线发生器。

尽管设备简陋、数据粗糙,例如据媒体报道,当时的车顶摄像头只能输入 30×32 像素的网格,但借助突破性的神经网络,名为“ALVINN”的自动驾驶汽车可以最高时速可达88公里/小时。

ALVINN被誉为自动驾驶领域的里程碑项目。

大模特上车了,特斯拉带好了吗?

其最深远的影响是用神经网络替代了人工编码,成为自动驾驶技术后续发展的灯塔。

在接下来的几十年里,自动驾驶技术沿着ALVINN的方向快速发展。

直到chatGPT的出现,大型模型登场,成为改变自动驾驶世界的变量。

在汽车方面,大型模型已经应用于自动驾驶的感知和预测,并正在向决策层渗透;在云端,大型模型为L3及以上自动驾驶的实现铺平了道路;甚至,大型车型将加速城市NOA的实施。

在全球下游企业中,特斯拉无疑是少数走在前列的企业之一。

今年8月,特斯拉的端到端AI自动驾驶系统FSD Beta V12版本公开亮相。

据称,它可以完全依靠车载摄像头和神经网络来识别道路和交通状况并做出相应的决策。

这种端到端模型的感知与决策一体化,使得自动驾驶可以直接从一端输入图像数据,从另一端输出操作控制,更加接近真实的人类驾驶。

然而,当车企努力向端到端模式靠拢时,却发现想要超越,必须先跟随。

01 算法第一 让大模型上路,特斯拉*是最激进的一个。

早在2009年,特斯拉就开始布局自动驾驶软硬件自研,并于2012年陆续实现算法和芯片自研。

随后在2016年,特斯拉的自动驾驶迎来了大规模升级:不仅将Mobileye的Autopilot 3.0替换为FSD Beta,算法也从原来的2D+CNN升级为BEV+Transform。

Transformer 就是 GPT 中的 T。

它是一个深度学习神经网络。

其优点是可以实现全局理解的特征提取,增强模型的稳定性和泛化能力。

BEV的全称是Bird’s Eye View,是一种将三维环境信息投影到二维平面上,以鸟瞰的方式显示环境中的物体和地形的方法。

与传统小车型相比,BEV+Transformer提高了智能驾驶的感知和泛化能力,有助于缓解智能驾驶的长尾问题:1)感知能力:BEV具有统一视角,融合了激光雷达、雷达和摄像头的融合将多模态数据集中到同一平面上可以提供全局视角并消除数据之间的遮挡和重叠问题,提高目标检测和跟踪的准确性; 2)泛化能力:Transformer模型可以实现全局理解的特征提取,有利于发现事物本身的内在联系,让智能驾驶能够学会总结而不是机械学习。

2016年,特斯拉在算法中引入了顺序网络,并将BEV升级为Occupancy Network,有效解决了从三维到二维过程中的信息丢失问题。

从感知算法的进展情况来看,今年及之前业界整体商业应用以2D+CNN算法为主。

随着ChatGPT等大型AI模型的兴起,算法升级为BEV+Transformer。

从时间上来说,特斯拉具有*优势(年)。

国内小鹏、华为、理想等今年才改用纯电动+变压器。

但无论是特斯拉还是国内整车厂,BEV+Transformer仍然只用在传感侧。

虽然学术界以最终规划为目标,提出了感知与决策一体化的通用大规模智能驾驶模型UniAD+全栈Transformer模型,但由于算法复杂+算力要求大,实现目标尚无准确的时间表。

02 算力竞争 2002年,因涉及辅助驾驶的致命事故而与Mobileye分道扬镳的特斯拉找到NVIDIA定制算力达24TOPS的计算平台Drive PX2,拉开了车企疯狂追捧的神奇序幕的计算能力。

继Drive PX2之后,英伟达在六年内发布了三代智能驾驶芯片,从Xavier到Orin再到Thor。

算力从30TOPS跃升至TOPS,增长了83倍,比摩尔定律还要快。

上游算力的“疯狂”积累,归根到底是因为下游有人买单。

一方面,随着智能汽车上传感器的规格和数量的增加,数据水平猛增。

以特斯拉Model Y和小鹏G6 Max为例。

后者需要的计算能力是前者的3.5倍,因为它配备了更多的传感器。

当自动驾驶汽车每天可以产生数TB甚至数十TB的数据时,数据处理能力是验证自动驾驶技术的关键点之一。

另一方面,“大建模”也使得智能驾驶算法的芯片算力日益紧张。

上汽人工智能实验室测试显示,仅需10 Tops以内的算力即可实现L2级自动驾驶,实现L4级自动驾驶只需约Tops左右的算力。

下游企业对算力需求暴涨其实还有其他原因。

一是云计算能力。

自动驾驶系统的早期和后期发展都依赖于大量的环境数据输入来训练和验证算法。

同时,模拟测试时的场景构建和渲染也需要较高的计算能力支持。

而且,特斯拉领导的神经网络Transformer也是资源消耗大户。

好墨智行数据显示,Transformer 在训练端需要的计算能力是 CNN 的两倍。

因此,下游企业想要获得算力,要么自己建设智能计算中心(特斯拉),要么与云服务商合作。

最糟糕的选择就是将算力全部外包,包括算法、计算资源、应用服务等。

虽然国内主流整车厂/自动驾驶厂商的智能计算中心已经全部上线,但由于自建成本较高,大部分国内主流自动驾驶厂商采取合作模式/采购模式。

例如,吉利星瑞和小鹏福耀都是由阿里云提供支持的。

、莫莫和理想都是火山发动机。

但从长期成本优势来看,自建倾向依然较高。

另一个是NOA。

现实中,主机厂搭载城市NOA高端智能驾驶功能的车型,大部分算力都在TOPS左右。

然而,在NOA从高速公路向城市道路(高速公路-城市快速路-城市主干道-城市次干路-城市支路)拓展的过程中,人流变得更加密集(每年只有25%的人通过高速公路出行)。

当天,而城市道路的道路环境复杂度越高,对物体识别、感知融合和系统决策的算力要求就越高,木希首席产品官孙国梁指出,要在上面部署大型模型。

汽车端要能够完成设定的任务,算力至少要达到~TOPS,模型优化可能会降低算力要求,但考虑到未来场景复杂度和数据量的增加,以及比例的增加。

视觉感知(相对于基于规则),车端算力或将翻倍至TOPS以上 03 感知升级 光大证券判断,三大要素重要性顺序从L2/L2+走向L3高。

高端智能驾驶是数据>算法>硬件,后期向更高端智能驾驶迈进的顺序可能是硬件>=算法>数据。

理论依据是,实现L3智能驾驶的关键在于综合感知,主要依靠海量+长尾场景数据来驱动算法升级和优化;其中,需要低线城市数据覆盖非成像场景(对比目前车载算力基本足够L3-L4级别要求)。

现阶段,海量+长尾场景数据的获取依赖于车载传感器(摄像头)的大幅升级。

根据 Yole 的报告,自动驾驶 L1-L3 所需的摄像头数量增加了一倍。

例如,L1-L2只需要前后两个摄像头,L3则需要20个摄像头。

事实上,主机厂为后续OTA升级预留了冗余,而自行车的摄像头配置远远超过了该级别所需的摄像头数量。

例如特斯拉Model 3配备9个摄像头,蔚来、小鹏、理想车型则配备10-13个摄像头。

此外,由于大型模型对传感数据的精细化要求,深度学习模型中高分辨率图像数据可以作为更新和优化其架构参数的数据源,特别是前视摄像头,需要解决最多场景和目标识别任务。

最复杂的,比如远距离小目标识别和短距离目标切入识别。

为了识别和监控更远距离的目标,车载摄像头必须升级到百万像素或更高。

典型的例子是百度Apollo,它与索尼、联创、黑芝麻智能联手打造了全球首款超百万像素车载摄像头模组。

在提升感知能力方面,有两个障碍是所有车企都想回避的,即高精度地图和激光雷达。

高精度地图作为先验信息,可以为自动驾驶提供大量的安全冗余。

在数据和算法成熟之前,主机厂对它们的依赖程度很高。

地图下架的原因相对容易理解:1)高精度地图存在更新周期长、成本高、地图经销商资质收紧等缺点,限制了高端自主大规模商业化的可能性驾驶。

2)构建数据闭环,形成算法模型的迭代升级并反馈给车端。

至于如何摆脱地图,特斯拉的做法是引入车道线网络和新的数据标注方法。

国内领先的自动驾驶公司采用车端实时地图解决方案,利用安装在车辆上的摄像头等传感器构建车辆行驶过程的地图。

周边环境地图。

目前,小鹏、华为等领先整车厂均已发布无高精度地图的高端智能驾驶解决方案,并制定了量产时间表。

华为、好墨、圆融七星等自动驾驶公司也纷纷加入,自动驾驶算法“重要”。

“感知、光图”趋势明显。

激光雷达是由于成本问题。

激光雷达在距离和空间信息方面具有精度优势。

搭载激光雷达的多传感器融合感知解决方案,可以通过互补实现全环境感知能力,为高级别自动驾驶提供安全冗余。

但激光雷达确实是一个成本大的玩家。

早些年,除了特斯拉之外,几乎所有成熟的无人驾驶技术方案都采用了64位激光雷达。

其造价约为70万元,一个小雷达抵得上一辆车。

甚至几辆车。

特斯拉利用占领网络来实现类似于激光雷达的传感效果。

由于缺乏机器视觉算法,预计国内整车厂仍将使用激光雷达作为重要的补充传感器,这可以减少视觉领域需要积累的数据量。

此外,4D成像毫米波雷达可能完全取代3D毫米波雷达,并有望取代低线激光雷达。

与激光雷达相比,4D成像毫米波雷达的部分指标接近16线激光雷达的性能,但成本仅为激光雷达的十分之一。

基于全新自动驾驶硬件HW4.0,特斯拉首次为S/X车型配备了4D毫米波雷达。

除特斯拉外,40万元以下的理想车型、70万元以上的宝马车型、通用汽车收购的Cruise自动驾驶服务车近两年都完成了4D毫米波雷达的布局。

与此同时,大陆、采埃孚等汽车一级巨头也基本完成了在该领域的布局。

04 尾声 8月,马斯克亲自启动了FSD Beta V12的现场试驾。

在45分钟内,FSD Beta V12系统在整个驾驶过程中进展非常顺利,能够轻松绕过障碍物并识别各种路标。

马斯克兴奋地说:V12系统自始至终都是通过AI实现的。

我们没有编程,没有程序员写一行代码来识别道路、行人等,这一切都交给了神经网络。

而这一切都是建立在海量的“视频数据”和一万个H的基础上的。

遗憾的是,这两项战略资源并不是国内主机厂能够轻易赶上的。

【本文由投资社区合作伙伴微信公众号授权:解码。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

大模特上车了,特斯拉带好了吗?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 拥有90万粉丝的日本第一自媒体《东京新青年》获2000万元投资

    拥有90万粉丝的日本第一自媒体《东京新青年》获2000万元投资

    据投资界7月3日消息,日本第一自媒体《东京新青年》获2000万元投资1万元,个人资助。   有趣的是,日本第一自媒体《东京新青年》的成立是受到中国大环境的影响。 创始人和王宇龙曾在中国留学,受到中国微信、微博等移动社交软件的兴起以及新媒体的爆发式增长的启发,于是顺

    06-18

  • Mantis Vision完成1.38亿元A轮融资,商汤国香领投,京沪引导基金跟投,

    Mantis Vision完成1.38亿元A轮融资,商汤国香领投,京沪引导基金跟投,

    投资界(ID:pedaily)据11月18日消息,螳螂视觉科技有限公司(以下简称“螳螂视觉”“视觉”)宣布完成人民币1.38亿元A轮融资由商汤国香资本(人工智能产业基金)领投,文兴盛世、普拓投资跟投,原股东Mantis Vision继续跟投。 本轮融资将主要用于3D技术软硬件研发、3D工作室

    06-18

  • 海智在线完成近亿元B轮融资,由洪泰基金领投

    海智在线完成近亿元B轮融资,由洪泰基金领投

    据投资界3月18日消息,海智在线非标零部件领域专业服务平台宣布完成近亿元B轮融资。 据悉,本轮融资由洪泰基金领投,钟鼎资本跟投,毅仁资本担任本轮融资独家投资方。 自2016年成立以来,海智在线已获得海尔、清华控股旗下沃富资本、钟鼎资本、智能数据资本以及本轮弘泰基金

    06-17

  • “用户运营合伙人”兑吧集团获兰信亚洲、TPG投资的C轮融资

    “用户运营合伙人”兑吧集团获兰信亚洲、TPG投资的C轮融资

    据投资界8月22日消息,兑吧集团今日宣布完成1.1亿美元C轮融资。 投资方为兰信亚洲、TPG。   兑吧集团创始人及CEO陈晓亮表示,集团将继续致力于打造更好运营的全链路服务。 本次融资将主要用于加大集团技术创新投入,持续推动现有业务升级,扩大市场份额;它还将用于创新企业

    06-18

  • 京东数科完成收购毛库科技,深度拓展商场数字化服务

    京东数科完成收购毛库科技,深度拓展商场数字化服务

    投资界消息(微信ID:pedaily),京东数科近日完成并购毛库科技,深度拓展数字化服务购物中心的服务。 领域,完善产业数字化布局。 合并后,京东数科以客户为中心,协助毛库科技拓宽商场数字化服务边界,提升挖掘客户价值的能力。 毛库科技成立于2016年,专注于购物中心领域的

    06-17

  • 豫能科技完成数千万元Pre A+轮融资

    豫能科技完成数千万元Pre A+轮融资

    》据5月20日消息,国内新材料企业“豫能科技”近日宣布完成数千万元Pre A+轮融资,由北汽产业投资领投,富临创投、云沐资本跟投,云沐资本为本轮唯一融资来源。

    06-18

  • 泽润生物获盈科资本、高瓴资本等6家投资者联合增资

    泽润生物获盈科资本、高瓴资本等6家投资者联合增资

    据投资界12月18日消息,沃森生物昨日发布公告显示,旗下泽润生物获最新一轮增资,领投方为沃森生物。 盈科资本、泰格医药、高瓴资本等六家新投资人共同投资,推动中国首个HPV宫颈癌疫苗产业化。 HPV感染是宫颈癌的主要原因,早期接种HPV疫苗可以有效预防宫颈癌。 目前国外已

    06-17

  • 博通:迁移到16nm将缓解Wi-Fi 66E芯片的供应压力

    博通:迁移到16nm将缓解Wi-Fi 66E芯片的供应压力

    博通表示,该公司Wi-Fi核心芯片的交付周期平均为52周,尽管这是由于代工产能紧张所致芯片制造商。 Class 芯片已获得优先发货,但转向 16nm 制造工艺可能有助于缓解供应限制。 据《电子时报》报道,博通中国台湾高级总监Alex Chou指出,Wi-Fi6/6E芯片目前主要采用28nm节点生产

    06-08

  • 滴滴和Uber与尚存的合并存在不确定性,政策监管或成一大障碍

    滴滴和Uber与尚存的合并存在不确定性,政策监管或成一大障碍

    上周以来,滴滴与Uber将合并的消息在网络和各大媒体上持续发酵,引发社会各界广泛关注。 昨天,滴滴正式宣布与Uber中国合并,此事终于尘埃落定。 不过,从今日最新消息来看,两家公司正式完成合并之前,还存在诸多变数。 据8月2日最新消息,在今天上午举行的例行新闻发布会上

    06-18

  • 韩媒:在基础科学技术领域,韩国仍落后于日本

    韩媒:在基础科学技术领域,韩国仍落后于日本

    韩国工业联合会(FKI)8月12日发布的报告指出,韩国国家竞争力排名已超越日本,但日本的材料及零部件技术仍领先韩国。 据BusinessKorea报道,报告显示,韩国对日本材料及零部件贸易逆差从去年的83亿美元增至83亿美元,且项目逆差占对日逆差总额的比重也持续增加,这意味着韩国

    06-08

  • SK海力士Q3营业利润创三年新高,看好存储芯片需求前景

    SK海力士Q3营业利润创三年新高,看好存储芯片需求前景

    受益于价格上涨,存储芯片巨头SK海力士周二公布近三年来最高季度营业利润。 该公司还预测存储芯片的需求稳定,这比美光(MU.US)等竞争对手更为乐观。 SK海力士宣布,第三季度营收同比增长45%,达到创纪录的11.8万亿韩元,而市场预期为11.9万亿韩元。 第三季度营业利润增至4.

    06-08

  • 联黛首战大捷,赴美上市首日股价暴涨近九倍

    联黛首战大捷,赴美上市首日股价暴涨近九倍

    联黛上市首日开盘价11.4美元,涨幅% IPO 价格。 随后,股价一路飙升,盘中涨幅超过%。 大约九次熔断后,收盘价为 39 美元,涨幅高达 30%。

    06-17