蚂蚁链宣布开放数字版权服务平台,AI+区块链技术联手保护原创
06-18
8月7日,全球人工智能与机器人峰会(CCF-GAIR)在深圳前海华侨城JW万豪酒店拉开帷幕。
本次会议由中国计算机学会(CCF)主办,香港中文大学(深圳)、雷锋网(公众号:雷锋网)协办,鹏程实验室、深圳研究院协办人工智能和机器人技术。
从2018年学术界与工业界的融合,到2016年的产业落地,再到2018年的垂直细分,再到2017年中国人工智能诞生40周年,峰会一直致力于打造规模最大、层次最高、中国人工智能和机器人领域最具跨境学术研究中心。
产业和投资平台。
根据会议安排,8月8日,在“机器人前沿专场”上,清华大学研究员与UBX人形机器人首席科学家、赵明国、教授分别发表了题为“《基于计算的智能机器人控制》”的主题演讲。
赵明国教授表示,在传统控制系统中,算法能力往往受到控制器的限制。
智能机器人要实现多模态非常不方便。
它要么实现困难,要么功耗高、体积大。
如果将AI芯片集成到In机器人中,提供算法和算力支持,可以有效解决机器人运动和感知问题。
演讲中,赵明国教授介绍了其最新的机器人案例——无人驾驶自行车。
该机器人能够应对复杂现实环境中变速、不同粗糙度、不同路面材质等干扰因素的影响,实现完全自主行驶。
在他看来,无人驾驶自行车的实现过程需要满足三个基本功能: 运动控制:通过在嵌入式系统上运行控制算法来实现。
定位导航:通过高频系统的迭代运算实现。
交互与感知:利用GPU并行计算进行识别或算法推理来实现。
其中,对应的三种算法要求均可以由芯片完成。
赵明国教授表示,他们在无人驾驶自行车中内置了“天极芯片”,实现了行驶路径识别、障碍物识别、语音导航、运动控制等多种功能。
这款芯片是清华大学石路平教授团队去年推出的类脑芯片。
它可以同时实现三种不同的算法,并且是动态的、可定义的和可重新编程的。
基于天极芯片对无人驾驶自行车的演示验证,赵明国教授为智能机器人未来的研究方向提出了两条新路径:芯片+机器人:以机器人作为芯片和AI算法的研究平台。
机器人+芯片:以芯片作为机器人控制和智能算法实现的平台。
在他看来,未来智能机器人将与人工智能技术深度融合,AI芯片将在机器人控制领域释放更多潜力。
赵明国教授表示,无人驾驶汽车仅完成了地面行驶的首要任务,将进一步探索自行车如何实现飞向空中、落地等高难度特技。
在他看来,只有将控制问题推向极致,探索技术的边界,才能推动整个技术的进步。
我们的愿景是让机器人达到甚至超越人类操作自行车的水平。
此外,赵明国教授还分享了双足机器人的研究案例。
他强调,无论是腿式机器人还是轮式机器人,它们都是测试算法的工具或载体,其最终产品不会用于商业化。
会后,赵明国教授在接受雷锋网编辑采访时也表示,人形机器人目前还处于学术研究阶段,距离商业化还有一段距离。
从行业发展来看,由于研发投入高、技术路线长,很少有企业专注于仿人机器人的研究。
在国家政策的支持下,高校团队和一些企业研发团队做了大量工作,近年来不断发表突破性的研究成果。
此外,赵明国教授透露,目前他正在开展一些新的研究,预计明年将发表相应的成果。
以下为赵明国教授演讲全文。
雷锋网编辑整理整理,不改原意:大家早上好!今天我想和大家分享一下我们在制作机器人时遇到的问题和思考。
我的主题是“基于计算的智能机器人控制”。
在机器人控制过程中,我们需要使用控制器来实现各种算法,但是这里有一个实际问题,那就是控制器的能力决定了算法的能力。
很长一段时间,我们都没有办法突破控制器的限制。
该算法只能停留在比较初级或中级阶段,很难达到高级水平。
所以我们改变思路,让算法驱动控制器的发展。
这里我们做了两个实验案例,无人驾驶自行车和双足机器人。
值得注意的是,两个机器人之一是轮式的,另一个是足式的。
我制造轮式机器人不是为了实用性,也不是为了商业化。
自动驾驶自行车是我用来测试算法或解决某些问题的实验工具。
同样,双足机器人也被设计用来进行研究实验。
它们的实用性有待后续的商业开发。
“天极芯”驱动的无人驾驶自行车 首先什么是无人驾驶自行车?无需人类控制即可自主行驶的车辆称为无人驾驶车辆。
机器人本身涉及大量的动力学原理。
尽管自行车已经发明了近几年,但其机械机构却从未被彻底研究过。
直到2018年一群学者在《自然》杂志上发表文章,才对复杂动力系统进行了更彻底的解释。
我们在做机器人控制的时候,还需要充分利用自行车的动力学原理。
人们对自行车的控制能力很强。
例如,人们可以放开自行车,在校园或无障碍道路上骑自行车。
那么如何保持自行车平衡并自动行驶呢?其实这里面涉及到很多机械原理。
一般来说,有以下几个影响因素。
如果自行车在弧形轨道上行驶,就会产生离心力,有助于保持平衡。
自行车特殊的前叉结构——前叉角度和前轮拖距。
这两个物理参数的变化将自动对车把自动伸直和保持平衡发挥重要作用。
整个车体质量的均衡分布也是保持平衡的原因之一。
当人骑自行车时,上半身的运动会产生反作用力,使自行车保持平衡。
车轮的陀螺效应和陀螺扭矩将帮助汽车保持平衡。
安装反作用轮(航天器上常用)或添加扭矩陀螺仪会产生平衡效果。
上面提到的前两项是我们的研究方向,中间三项需要安装外部设备,与独立自行车无关,最后一项与研究原理无关。
所以我们只选择了前两项。
我们在使用前两项进行控制时遇到了一些困难,例如低速和变速行驶影响的离心力、风的干扰、大坡度、负载变化以及车轮与不同地面的相互作用等。
下面是一个比较简单的自行车动力学模型,其中车身、车把和行驶速度可以用三个变量来描述。
描述这三个变量后,我们可以得到一个动力学方程,该方程具有很强的非线性。
它是线性的,不同状态下的角度和车速是耦合的,对参数也很敏感。
另外,我们可以看到,方程中的很多参数都与速度有关。
每当速度改变时,动力学方程就会改变。
这对我们来说是一个有趣的挑战。
如果我们能够解决速度的影响,我们的控制算法就能更近一步。
单速的车把转向控制可以用普通的控制方法来解决。
我觉得大二、大三的学生可以尝试做定速自行车实验。
我们要做的是如何解决变速下的车把转向平衡控制。

我们之前曾尝试过采用速度估计+分段控制的方法来实现变速控制。
当时我们花了一个多月的时间手动调整了大约20个段的参数。
通过随着速度变化进行切换,可以更好的解决小车的稳定性问题;然后我们使用这些数据作为强化的初始参数。
学习后,效果会更好,可以适应地面材料。
遗憾的是,零初始知识情况下的学习并不成功,虽然利用Segway平衡车在零知识情况下的强化学习,我们实现了正负10度范围内的平衡。
因为我学的基础知识是线性部分,所以没有应用到自行车上。
因此,我们得出结论,“暴力”强化学习可能不适合这个问题,需要进一步探索。
我们的无人驾驶自行车在普通自行车的后轮上增加了一个驱动器,在前车把上增加了一个方向盘,刹车,控制器以及各种相应的传感器和电池,这样自行车就已经可以实现定速行驶了。
事实上,任何控制器本身通过反馈控制都具有一定的鲁棒性,因此在基本道路上行走是没有问题的。
只要各速度下的参数匹配良好并实现平滑切换,就能获得较好的鲁棒性。
此外,我们还实现了变速自动引导行走。
这是我们在清华校园拍摄的一个短视频。
视频中的自行车可以从低速行驶到高速,穿过不同粗糙度、不同材质的道路。
我们给它添加了传感器。
对于路面识别,它还可以导航相对简单的路径。
为了达到这个效果,我们做了几件事。
除了实现机器人控制之外,还增加了感知模块,所以这就是我们的动力学模型。
从图中两个红圈来看,有些项目与陀螺效应有关,有些项目与离心力有关,有些项目与结构有关,最重要的第一项与重力有关。
这些项目会随着速度不断变化。
传统的方法是使用NI控制器或者任何工业控制器,然后集成大量传感器来达到这种效果。
当然,也有一个失败的过程。
我们经常会摔倒,然后重新调整参数,然后再尝试。
然而,这是一种相当传统且复杂的机器人控制方法。
后来我们就不再这样做了。
传统任务中的运动控制需要嵌入式系统,因为嵌入式系统需要实现控制算法。
同时做定位和导航的时候,我们需要一个高频的系统来做迭代运算,比如SLAM或者其他(SLAM也可以在GPU上完成)。
交互和感知往往需要使用GPU来执行一些识别或推理算法。
总之,适合并行计算、高频计算和实时性要求。
智能机器人中同时需要这三类计算。
尤其是我们在参加RoboCup比赛时制作的人形机器人,需要同时进行这些类型的计算。
最简单的方法是使用三台计算机。
这三台计算机需要有不同的计算能力,然后用网线将它们连接起来,并使用操作系统来维护数据。
交流。
这次我们没有采取这样的做法。
去年,清华大学史路平-教授团队发布了一款名为“天机芯”的类脑芯片,可以在一块芯片上实现三种类型的计算,并且是动态的、可定义的、可重新编程的。
这是两个或多个学科交叉的结果。
我们和做芯片的老师合作。
我们利用具备这些功能的芯片完成了三项测试任务。
如果这三个任务都能实现,就说明该芯片具备了这三个计算功能。
这是传统机器人控制硬件难以实现的。
如果能实现的话,体积会很大,功耗也会很高。
那么我们希望使用混合架构的芯片来实现这个功能。
因此,我们把行驶路径识别、障碍物识别、语音导航、运动控制等功能全部放到了一颗芯片中(当然不是一颗芯片,而是一块芯片阵列的主板)。
如上面的动画所示,芯片实现了所有的计算功能。
我们的工作成果于去年8月1日发表在《自然》杂志上。
这是我国人工智能领域研究在Nature上发表的第一篇文章。
受这项工作的启发,利用天极芯片完成无人驾驶自行车的演示验证,为自动机器人的研发提供了新的思路。
有两种方式:芯片+机器人:用机器人作为芯片或AI算法研究平台。
以此来证明算法的可行性。
算法在推进的同时反馈给机器人,最终推动高算力或多性能芯片的实现。
机器人+芯片:用芯片解决机器人算力不足的问题。
这套新的想法最早是张波老师在2008年《Science》发表的一篇文章中提到的,其目的是希望人工智能技术和机器人能够相互结合,相互促进。
目前,这一研究成果已得到国际知名杂志和专业人士的认可。
另外,值得一提的是,《Nature》杂志的编辑告诉我们,通常《Nature》发表的一篇文章的报道数是 ,但我们的文章的报道数达到了 10,000 篇,是迄今为止最好的。
算力支撑的技术挑战 到目前为止,对机器人控制和算力的需求还远没有结束。
我们经常在 YouTube 视频中看到一些山地越野挑战。
这些视频足以证明人类控制汽车的能力。
控制能力有多强。
我们的愿景是让机器人达到甚至超越人类操作自行车的水平。
因为这可以将控制问题推向极限,从而发现技术的边界在哪里,从而推动整个技术的进步。
从长远来看,未来的机器人控制可分为三个发展阶段: 第一阶段:自行车可以在低速、变速、崎岖/障碍道路下正常行驶。
第二阶段:自行车可以自主完成飞行、着陆等特技任务。
第三阶段:在实际应用中,集成了控制和感知系统的自行车可以像极限山地运动员一样在复杂的环境中自由移动。
目前,我们已经完成了初级阶段的任务。
中期任务和远期任务我们还没有明确的规划。
但可以肯定的是,这些任务的实施必须有强大的计算支持。
没有计算,其他部分无论我们做得再好,我们也做不到。
目标达到了。
双足机器人被动行走理论 早在2000年,就有人提出了机器人被动行走理论。
那时的机器人是纯机械结构。
只要给定初始条件,就可以产生稳定的行走。
2018年,康奈尔大学研究团队基于被动行走理论,研发出与人类相当的行走机器人。
当时,这项研究成果发表在《科学》杂志上,引起了不小的轰动。
从那时起,许多关于被动理论的扩展研究相继发表。
然而,除了哈佛大学研发的机器人软外骨骼之外,几乎没有任何研究成果能够带来实际应用价值。
外骨骼研究近年来一直是热门研究领域,中国有数十家公司在做这方面的研究。
它对于功能障碍人士和特殊工种确实具有一定的价值。
看到这些结果,我们对其中涉及的理论感到好奇。
人类的步态到底是什么?许多医学家在分析人的步态后发现,记录下来的行走轨迹就像一团乱麻,周期性但不重复。
起初,他们认为这是噪音或步态不均匀的结果。
最后他们发现,其实人的行走轨迹是混沌步态。
2007年,有人发现当参数变化到特定值时,被动模型会表现出混沌特性。
后来,这也在实物中得到了证实。
例如,我们使用被动理论构建了一个有腿机器人。
从其行走数据来看,有明显的混乱趋势。
那么问题来了,人类行走是混乱的,为什么机器人行走被控制在一个周期内呢? TED 上有一段视频,帕金森病患者上下楼梯时必须抓住扶手。
后来,他的孙女做了一个实验,在平地上画了多个台阶。
结果,病人可以在没有任何扶手的情况下行走。
完全独立行走。
当然,这与帕金森病的发病机制有关,但也说明与动力学有关。
帕金森病的本质是神经系统局部存在障碍、传导受阻。
这个案例说明,可以利用视觉刺激来恢复神经系统的正常功能,或许可以解决这个问题。
传统的步行机器人是根据单周期步态进行控制的。
首要解决的问题是稳定性,而人的步态可能是混乱的。
我们能否从被动行走中找到人类步态的一些动态解释,并利用这些动态来改进机器人或步行者性能的控制方法?如果按照混沌的特性来控制,可能会产生完全不同的效果。
在这里,我们对动态轨迹进行一些案例研究。
如下图所示:从SK出发,绕一圈回到下一个落地状态,循环往复。
从S0开始,下次降落在S1、S2、S3、S4时,红点就是最终目的地,是一个稳定值。
单周期步态是一致的,这与我们的系统非常相似。
如果我给系统这个参数,系统最终会跌到红点。
如果我给系统另外一个参数,用一个红色的参数来欺骗它,结果就是当它到了第二步或者某一步的时候,就会在红点附近通过。
。
显然对于目标红点,使用红色参数会比使用黑色参数更好(它有一个逐渐收敛的过程)。
如果你用一个虚假的目标来欺骗它,那么你就要考虑哪个目标会更好地欺骗它?这里需要进行很多计算。
首先,我需要知道红色轨迹和所有可能的黑色轨迹是什么,将它们全部计算出来,从中选择最佳轨迹,然后将参数发送到系统。
最后,系统相当于传统现代控制理论中状态方程的反馈控制问题。
该方法来源于混沌控制中最经典的OGY方法。
在这里,我们提出了一种MPC方法,通过大量计算发现MPC远远优于传统的OGY方法。
而且如果机器人即将摔倒,它还可以通过计算机找到合适的轨迹来恢复运动,这大大扩展了稳定的范围。
目前我们还不能实现在线计算和预测,但是我们已经实现了一个只有5组参数的实验。
即我们预先计算了5组不同参数的步态。
每组参数对应一个稳定的周期性步态,即5组不同的速度(草地、坡地、石板路等5种不同的路径)。
通过计算切换轨迹可以实现稳定性。
这和我们原来暴力增强稳定性的方法是不一样的。
我们的控制量不是控制系统的某个指标,而只是控制参数。
如果指标发生变化,我会更改参数而不是更改输入数量。
然后参数的变化被传送到每个关节的电机。
这样就可以产生与传统控制不同的替代结果,属于参数激励方法。
此外,我们还打造了一个真正的两条腿和两条手臂的步行机器人,这也需要严格依赖计算方法。
最终结果尚未得出。
后续我们有机会向大家展示最终的效果。
我今天的报告到此结束。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-21
06-18
06-06
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态