首页 > 科技未来 > 内容

阿里巴巴与自动驾驶的“殊死搏斗”,应用了AI科学家的“命中注定”故事

发布于:2024-06-17 编辑:匿名 来源:网络

9月27日,阿里巴巴宣布小蛮累计配送订单突破1万辆,并表示将启动自动驾驶卡车的研发。

长期以来,这家互联网公司经常以自动驾驶“投资人”的形象出现,但对于阿里巴巴自身在自动驾驶方面的实践以及背后的灵魂人物王刚却知之甚少。

阿里巴巴集团的王刚、副总裁、达摩院自动驾驶实验室的负责人,先后师从人工智能领域顶尖学者李飞飞(李飞飞)、大卫·福赛思。

获得新加坡南洋理工大学终身教职。

近日,雷锋网(公众号:雷锋网)与王刚展开对话,试图讲述王刚与阿里巴巴自动驾驶完整而又鲜为人知的故事。

2017年,王刚放弃了新加坡南洋理工大学的终身教职,毅然决定从学术界转向工业界。

阿里是他的第一站。

这次停留持续了五年。

他说,他喜欢在确定的情况下集中精力并坚持到底。

他不想要两者同时想要更多。

与“科学家”开朗的性格相比,王刚确实具有“重庆小子”的进取精神。

加入阿里巴巴后,王刚作为技术负责人,与阿里巴巴人工智能实验室(AI Lab)团队合作,打造了天猫精灵从演示到产品。

4个月内,它就成为了销量数百万的热门产品。

然后,他一挥衣袖,走上了一条看似极其漫长和艰难的路——从0到1的自动驾驶。

正因为如此,阿里巴巴的自动驾驶故事正式按下了启动键。

一切都是命运的故事,要从15年前说起。

当时,王刚就读于哈尔滨工业大学电子信息与工程学院。

虽然他一直对图像处理很感兴趣,但他万万没有想到自己与人工智能的缘分会来自于对一篇论文的思考。

作为一名非专业人士,王刚之前在图像处理方面做过很多研究,他也比同龄人更早开始关注学术论文。

大四的一天,人工智能顶级会议CVPR的一篇论文中提到的一个方法与王刚的想法不谋而合,于是他给论文作者写了一封信。

此后,两人的交流也越来越多。

而这也成为了一张通往新世界的门票,载着王刚漂洋过海来到了人工智能领域。

2006年,王刚从哈尔滨工业大学电子信息工程学院毕业,进入伊利诺伊大学香槟分校(UIUC)深造,跟随导师做了大量前沿研究。

计算机视觉方向。

UIUC拥有世界领先的计算机科学专业。

计算机视觉之父Thomas S. Huang曾在此任教,中国唯一的图灵奖获得者姚启智也曾在此学习。

至此,王刚真正踏入了人工智能领域,一切似乎都如命中注定般顺利。

但王刚发现,当时在UIUC乃至整个人工智能圈,很多学生在做研究时喜欢“刷排名”,特别关心重大比赛的最终结果。

他也清醒地认识到,顶尖学者的学术理念有一个共同点,那就是更注重本质问题。

因此,关注事物本身,探究事物背后的本质,是王刚在学习和工作中最注重的。

即使在离开学校多年后的今天也是如此。

在阿里巴巴从事自动驾驶工作时,王刚一直强调人工智能技术的本质是更好地构建数据驱动的系统,这就是他理解的“第一原理”。

在与雷锋网的交流过程中,他共提到“本质”17次,“第一性原理”16次,逻辑严谨。

寻找科技与生活的连接点。

积累了足够扎实的科研基础后,王刚于2016年开启了新的征程——加入新加坡南洋理工大学(NTU),组建了自己的研究团队。

他今年年仅28岁,已发表近10篇顶级会议论文,被引用过千次。

当时AI圈还没有进入深度学习论文泛滥的时代,王刚的成就在年轻学者中已经是令人瞩目的。

随着时间的推移,在新加坡沉浸在AI圈子里的王刚逐渐感觉到这里的学术氛围和学术应用与美国存在明显的差异。

他进一步向记者解释道:“在美国,人们不了解外界事物,只读圣贤之书。

就连我的导师也不怎么关心这些应用,更注重解决根本性的学术问题。

但在新加坡,大的大学环境更加注重与业界的融合。

阿里巴巴与自动驾驶的“殊死搏斗”,应用了AI科学家的“命中注定”故事

”也是在南洋理工大学任职期间,王刚开始与业界有更多的接触。

据了解,基于计算机视觉和深度学习两条主线,他带领团队开发了各类AI技术应用,涵盖服装、驾驶、医疗、安防等多个主流领域,并将部分技术转让给商业公司。

其中,他们在2016年开发了自动服装检索系统,这是比淘宝潘多拉更早的图像搜索应用。

他们还推出了3D人类行为标准数据集NTU rgb+d,后来被学术界和工业界使用。

用过的。

不仅如此,王刚还联合创立了一家名为I3 Precision的公司,并亲自担任CTO,希望通过技术提高药品验证的效率。

遗憾的是,这些项目受到应用场景等各种原因的限制,并没有对当时的市场产生变革性的影响。

但基于这样的实践,王刚也逐渐对“应用”有了清晰的认识,这为他后来向行业输出能力,找到科技与生活的连接点奠定了基础。

对此,王刚告诉雷锋网,学术研究正在蓬勃发展:有些人几十年磨一剑,为了科研理想愿意坐冷板凳。

就像神经网络教父杰弗里·辛顿(Geoffrey Hinton)曾经在一场持续了10多年的计算机科学学术大战中未能获胜一样,神经网络方面的论文也经常被学术期刊拒绝。

但杰弗里·辛顿最终证明自己是对的。

此外,还需要有人关注AI技术的应用——王刚认为自己是一位应用型学者。

而且,相比“科学家”,王刚更喜欢将自己定义为“工程师”。

在他看来,科学家要发现新的规律,创造新的知识,构建新的原理;而工程师则希望将这些原理以产品的形式发挥作用。

经过多年的研究和积累,王刚的原理已经非常明确:在当今的计算机架构下,人工智能要想实现快速发展,必须做好数据驱动;如果没有足够的滋养,科学家就很难发现新的东西。

促进人工智能进步的法律。

那么,数据从哪里来?从产品入手或许是一个好办法。

2006年,王刚获得南洋理工大学终身教职。

但仅仅一年后,他就毅然离开新加坡,带着家人回到中国,从学术界进入了行业。

其实,了解了王刚对于技术应用的想法后,他放弃体面稳定的大学工作就不那么难理解了。

尤其是现在身处中国人工智能圈,王刚更加坚定了走产业实施路线。

他向雷锋网透露,从美国、新加坡到中国,越往东走,越重视产学研。

国内一些教授的晋升和奖励也会以行业的成就作为参考指标。

“很多人抱怨我们太功利,不注重深入研究,但事实并非如此。

因为每个国家的国情不同,中国更注重产学研结合运用好再深入也是一种方法。

”在王刚看来,未来,现阶段我们只能从零开始,然后慢慢做深,然后做得更好。

这更符合发展规律。

做产品最重要的是思考。

阿里巴巴是王刚在这个行业的第一个立足点。

对于自己在行业的未来,他给自己定下了两个基本点:一是要继续做AI研究;二是要继续做AI研究。

其次,团队的领导者必须懂业务,而不仅仅是研究。

2020年3月,阿里巴巴启动了代号NASA的计划,将针对机器学习、智能芯片、生物识别等前沿技术组件组建新的团队,并动员全球2万名科学家和工程师投身其中。

新技术战略;王刚正就是其中之一。

看来阿里巴巴非常符合王刚的需求。

而阿里是一个足够大的舞台,可以让他尽情施展自己的技艺。

不过,王刚加入阿里巴巴人工智能实验室后,并不是仅仅开始自动驾驶。

相反,他被责令接手天猫精灵的研发职责。

据他当时的观察,人工智能产品在云端的应用案例很多,比如人脸识别、语言识别等,但在端侧,还是一个比较空白的市场。

而且终端产品需要考虑场景、计算等各种约束,更具挑战性,也是为自己打开行业入口的好机会。

几个月后,王刚和他的团队开发出了第一代猫精灵“天猫精灵X1”。

天猫精灵正式从演示走向可交付的量产产品,很快就成为百万出货量的爆款。

看到天猫精灵的发展越来越好,此时此刻,王刚又做出了一个出人意料的决定——主动带队做自动驾驶从0到1。

“这件事值得做,它属于达到技术应用第一象限,具有社会价值和商业价值。

”王刚解释道。

而他的决定也获得了阿里高层的支持和重视。

2020年10月,NASA计划的实体托管机构达摩院正式揭牌,其中包括一个自动驾驶实验室,随后由王刚掌舵。

起初,因为没有合适的场地,王刚带着几个朋友在西溪公园的车库旁边做了简单的改装,然后开始买车、改装、路试。

这个车库“创业”过程就是小蛮驴的起源。

虽然入行后一切都很顺利,但王刚也承认,自己过去做的很多前沿研究并没有什么用处。

他更感兴趣的是改变团队的思维。

比如,无论是做NLP还是视觉,无论是做天猫精灵还是小蛮驴,团队都要思考两个问题:一是如何获取场景数据,二是如何利用好这些数据。

据王刚介绍,刚接手天猫精灵时,他发现语料短缺严重,这会直接拖慢产品化进度。

但由于产品尚未成型,用户语料获取困难;相当于陷入了一个矛盾的境地。

困境。

为了解决这个问题,王刚提出花钱找志愿者编辑语料库,试图通过这种方式了解用户与智能音箱交互的偏好,然后收集这些语料库进行算法训练。

另一方面,王刚发现,很多工程师习惯用最前沿的技术来解决最简单的问题。

例如,智能扬声器经常接收打开和关闭灯的命令。

由于方向性思维,很多工程师会要求智能音箱应用自然语言理解技术来理解诸如开灯、关灯之类的短语。

但王刚认为,这是一个非常简单的问题,只要写一个规则就可以轻松解决。

自动驾驶也是如此。

阿里巴巴刚开始做自动驾驶时,一直以乘用车作为运行算法的实验平台,当时并没有明确的产品方向。

宣布进入码头物流赛道后,不可避免地引起了团队中部分同学的心理落差。

不过,王刚坚信终端物流是一个正确的战略选择:技术人员都想做看起来更有挑战性的事情(比如Robotaxi)。

这种对待技术的态度应该受到鼓励,但有时每个人都可能会被外面的噪音打扰。

他进一步表示,自动驾驶系统无疑需要数据驱动。

如果只有几百辆测试车,数据量是否足以支持在公共道路上实现完全无人驾驶?答案是否定的,没有一家公司能够负担得起数万、数十万辆道路测试车辆所需的资金。

同时,国内码头物流未来市场规模预计将突破1万台,市场需求就在那里。

基于这样的思考,阿里巴巴选择先找到一个垂直产品来落地,然后利用这个产品产生价值,推动业务发展,从而实现规模化,学习更多场景知识。

终端物流与阿里巴巴的商业生态完美契合,无需担心实施场景。

伟大的小蛮时代的开始。

事实上,阿里巴巴自动驾驶实验室很少对外说话,王刚也不喜欢出风头。

“大家没有必要互相制造焦虑,我们只有真正做到了,才会说到做到。

”虽然王刚的话有点拗口,但这就是他一直坚信的原则。

经过三年多的低调耕耘,他们于去年9月正式推出了小蛮驴。

一年后的今天,他们又达到了另一个里程碑:小蛮驴送快递突破1万单。

据了解,小蛮驴已部署在全国22个省份52个城市的校园;北起哈尔滨,南至南宁,已为超过20万人提供快递服务。

目前,小蛮的驴车队超过了卡车的大小,并且每天正常运行10多个小时。

预计三年内车队规模将扩大至10,000辆。

除了规模的扩张,王刚还分享了服务方面的改进。

他认为,对于一款新产品来说,用户体验尤为重要,无论是价格还是服务效果都需要满足用户的期望。

目前,用户对小蛮驴的满意度保持在98%。

面对多年来外界的一些质疑,王刚也回应称,码头物流虽然是低速场景,但并不是“低级难度”。

技术水平。

物流车与其他自动驾驶车辆一样,涉及算法、算力、硬件、系统等多个维度,必须在公共道路上行驶。

场景级别。

码头物流是典型的非结构化场景。

交通参与者除了人和机动车外,还包括各种小动物、非机动车、异形路障等,且没有标准化的车道设计和交通规则。

成本水平。

如果成本不能降低到量产水平,面向大规模应用的自动驾驶产品就只是纸上谈兵。

总而言之,小蛮的一万单只是一个起点。

为阿里巴巴自动驾驶技术的进一步发展奠定了良好的基础。

“至少这意味着我们看到了自动驾驶大规模落地的曙光。

”王刚这样评价小蛮的成就。

基于小蛮的自动驾驶技术框架AutoDrive和智能仿真平台,大满路的研发也在紧锣密鼓地进行中。

王刚告诉我们,大满路是达摩院自主研发的L4级车。

驾驶卡车适用于城市配送,应用场景包括城市快递网点和快递终端节点之间的物流配送。

无人驾驶卡车在数万条公共道路上随处可见,同时也不排除未来阿里巴巴布局乘用车的可能性,毕竟阿里巴巴对于自动驾驶的整体逻辑已经逐渐清晰——从低到高。

从中速到高速,逐渐从垂直领域、无人领域向更主流、更广泛的场景推广。

到最后我就爱折腾。

“在交流过程中,王刚曾这样评价自己。

从电子信息工程到人工智能,从海外到中国,从学术界到工业界,从天猫精灵到小蛮的驴子,他确实一直在尝试各种各样的挑战。

” “我也很幸运。

”他回忆起自己的过去。

他告诉我们,当他进入这个行业时,他的妻子非常支持他的决定,并和他一起回到了中国;当他想做自动驾驶时,即使面临巨大的不确定性,公司也相信他。

判断。

如果他不喜欢乱搞,运气差一点的话,阿里自动驾驶的故事可能会彻底改写。

但庆幸的是,一切都是最好的安排。

如需转载,请前往雷锋网官网。

如需申请授权,请点击“阅读原文”查看原文。

阿里巴巴与自动驾驶的“殊死搏斗”,应用了AI科学家的“命中注定”故事

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 恒力华振完成数千万元Pre-A轮融资,大辰创投领投

    恒力华振完成数千万元Pre-A轮融资,大辰创投领投

    投资行业消息,据36氪报道,工业互联网公司恒力华振近日宣布完成数千万元融资Pre-A轮融资。 本轮融资由大辰创投领投,明照资本跟投。 据了解,本轮募集资金将主要用于产品研发及进一步商业落地。 恒力华振成立于2007年,瞄准生产过程质量监控市场,为客户提供设备数字化、智能

    06-17

  • CES 2023今日总结:实用主义重回主流,今年的PC性能大战即将打响

    CES 2023今日总结:实用主义重回主流,今年的PC性能大战即将打响

    国际消费电子展(CES)作为年度首个科技展,于今日早早开幕。 虽然今天还没有正式开始,但不少厂商已经迫不及待地拿出自己的美味佳肴让现场媒体抢先尝鲜。 前面我们的记者还在路上。 今天小编就给大家总结一下那些让人胃口大开的新品。 英特尔算力领先,发布第13代全新处理器

    06-21

  • 首期5亿元,杭州零磁装备成果转化基金成立

    首期5亿元,杭州零磁装备成果转化基金成立

    投资界(ID:pedaily)消息,4月11日,环境科技创新平台创新生态系统暨环境科技创新平台动员大会杭州江南科学城建设举行。 会上,举行了零磁装备成果转化基金设立签约仪式和环境科技创新平台创新生态联盟成立仪式。 零磁装备成果转化基金首期规模5亿元。 拟由杭州市科技创新集

    06-17

  • 富邦股份上市 华工创投、江苏华工创业投资基金、天津博润和武汉高农生物创投获得退出

    富邦股份上市 华工创投、江苏华工创业投资基金、天津博润和武汉高农生物创投获得退出

    富邦股份上市。 华工创投、江苏华工创业投资基金、天津博润、武汉高农生物创投退出。 2019年7月2日,湖北富邦科技股份有限公司在深圳创业板挂牌上市。 湖北富邦科技有限公司成立于 。 湖北富邦科技有限公司是由湖北富邦化工科技有限公司整体变更设立的股份制公司。 2019年11月

    06-17

  • 图文视频之后,音频自媒体的未来

    图文视频之后,音频自媒体的未来

    本文来自福布斯、作者和王每君。 对播客未来的 10 个预测是两年前的今天写的。 2年前,荔枝FM还没有上线,小宇宙还没有上线,TME还没有官宣Director Audio,字节还没有推出番茄收听,网易还没有更新8.0版本的播客,没有底指南中,快手和百度尚未进入播客行业,微信音频尚未推

    06-21

  • Snap It是一款减肥工具,可以通过拍照来计算食物卡路里

    Snap It是一款减肥工具,可以通过拍照来计算食物卡路里

    FitNow是一家位于波士顿的移动应用开发公司。 他们推出了一款应用程序“Lose It”,可以用来追踪食物摄入量和运动量——它是今年苹果商店推出的首批应用程序之一。 而且8年后,这款应用仍然是Apple Store和Android应用商店中排名第一的减肥健康应用。 FitNow 联合创始人兼首席

    06-18

  • 日托机构EarlyBird完成天使轮融资

    日托机构EarlyBird完成天使轮融资

    据投资界5月21日消息,高端日托机构EarlyBird完成天使轮融资。 投资方为万新集团和清河投资。 公开资料显示,早鸟成立于2006年,是一家针对0-4岁婴幼儿的高端托育机构。 公司为社区家庭提供ToC全日托、半日托等托儿服务;同时还根据企业个性化需求提供ToB服务。 目前在北京设

    06-18

  • 米文动力获数千万元A+轮融资

    米文动力获数千万元A+轮融资

    据投资界6月3日消息,据36氪报道,米文动力近日宣布获得数千万元A+轮融资。 本轮投资由北汽产业投资领投。 赛智创投跟投。 公司此前已获得云天使基金等天使轮投资,以及博彦嘉铭、硅谷资本中国等数千万元A轮投资,据了解,本轮资金将用于增加产品线、扩大产能、发展垂直行业

    06-18

  • 半导体投资2320亿,三星力压群雄

    半导体投资2320亿,三星力压群雄

    据报道,韩国三星电子2016年在芯片工厂和设备上的投资比台积电、英特尔等任何竞争对手都多。 三星电子周三(9日)表示,已投资43.6万亿韩元(约合人民币1亿元)升级和扩建位于韩国和中国的芯片工厂。 这些工厂生产先进的 DRAM 芯片和垂直 NAND 闪存芯片。 资金也得到了补充。

    06-08

  • 这个看起来像软糖的7厘米小玩意实际上是模仿猎豹的“最快”软机器人,长

    这个看起来像软糖的7厘米小玩意实际上是模仿猎豹的“最快”软机器人,长

    7厘米,重45克。 它可以在陡坡上奔跑、在水中游泳、奔跑、跳跃、举起重物……而且它只是一个看起来像软糖的软体机器人。 也许它最霸气的一面就是它模仿的猎豹。 是的,它与追逐“糖蜜”的是同一种动物,但它也是陆地上速度最快的生物。 软机器人看起来像这样。 以“小猎豹”妖

    06-18

  • 马化腾陷入玻尿酸陷阱

    马化腾陷入玻尿酸陷阱

    作者|徐明辉编辑|柳儿源|创作当年,由尤小刚执导,姜文、王姬主演的《北京人在纽约》热播。 孔府佳酒邀请王姬担任品牌代言人。 “功夫甲酒让人思乡”的说法传遍大江南北。 那是鲁九的辉煌时代。 央视春晚的“王”大多是鲁九拿下的;中国白酒销量前十名中,绿酒占据四席。

    06-17

  • 搜狐视频的变化:并购和网络渠道合作可能是一个突破

    搜狐视频的变化:并购和网络渠道合作可能是一个突破

    闭关两年回来的张朝阳,发现自己找到了一份令人兴奋的工作。 昨天,搜狐宣布,搜狐集团董事局主席张朝阳正式出任搜狐视频代理CEO。   虽然这个消息在业内没有并购消息那么重要,但搜狐视频的人事变动还是引起了业界的震动:搜狐视频要努力了!   张朝阳被任命为搜狐视频代

    06-18