最近几个星期的时间,乌克兰马里,乌波尔钢铁厂地下工事的攻防战变成全球军事界关注的焦点,俄罗斯方面付出重大伤亡,也没有能够完全清剿地下工事里的乌克兰军队,甚至连这个地下工事到底是什么规模什么走势,什么结构,都没有一个固定的说法。这迫使俄罗斯领导人给自己找了一个台阶下,在并没有完全攻克地下工事的情况下,就匆忙宣布战斗已经结束。
这场战事清晰地向人们展示了地下空间作战的残酷性和长期性,那么应用先进信息技术的人工智能机器人,能不能完全改变地下战场?作战方式将是一个重要的话题。
作为全球公认的前沿技术探索者,美国国防高级研究计划局(DARPA)在战术战法上向来有前瞻性,他们于2018年发起了“机器人地下挑战赛”,参赛机器人需要克服通信、导航、地形等多方面的难题,在未知的复杂地下空间完成特定任务。DARPA未必预料到了乌克兰战争,但是他们准确地预料到了,在未来战场上,地下空间将是一个不可忽视的领域。
这次挑战赛最有价值的地方在于,DARPA 刚开始知道机器人并没有这种能力,但提出要求并经历三年的比赛之后,最终形成一支存在竞争力的机器人团队。
谈到移动机器人,你可能经常遇到,比如在酒店、医院、餐饮等服务领域,经常会看到机器人的身影。除此之外,波士顿动力公司 (Boston Dynamics) 的网红机器人,各种摸爬滚打的视频在网络上也吸引了众多关注。
但在一些更复杂、极端的环境下,机器人依旧叫好不叫座,亟待技术层面的深层突破。
这样的局面,曾经的无人驾驶也遇到同样的问题。从 2004 到 2007 年,美国国防部高级研究计划局(DARPA,Defense Advanced Research Projects Agency)赞助了无人驾驶挑战赛。大赛除了捧红了激光雷达公司 Velodyne,同时也直接催生了此后十几年火热的无人驾驶赛道。
遵循同样的思路,2018 年 DARPA 组织了机器人地下挑战赛(Subterranean Challenge,SubT),并设置了 500 万美元的奖金,吸引世界各地的机构和公司的工程师和科学家团队来参加比赛。
如今,此次持续近三年的系列赛已经落幕,最终 CERBERUS 团队和 CSIRO Data61 团队,分别获得决赛的第一名和第二名。
除了比赛结果,这次挑战赛更大的价值,在于对现实的映射。回顾这场比赛中遇到的问题和给出的解决方案,可以更深层地了解机器人发展的动向,以及加速机器人的普及。
谈起举办这次地下挑战赛的直接契机,DARPA 战术技术办公室项目经理 Timothy Chung 表示,这主要考虑到作战人员的需求,以及先遣应急队的需求。他们要在各种地下环境中执行搜索和救援的任务,可能是人口密集的事故、自然灾害,也可能是矿山中等救援。
同时,在这次挑战赛的官网,引用了克劳塞维茨在《战争论》中的一句话,「战争与地形的关系,要求我们具备快速而精准地获取任何地区地形信息的能力。」
在比赛场地的选择上,这次地下挑战赛选取了地下隧道、城市地下、岩洞三个最具挑战性的场景。在这样的环境中,机器人将面临很多极限的情况,比如地形很复杂,没办法使用 GPS,通信受到限制,能见度低,移动性也受到挑战等等。简单说,DARPA 的目标是要寻找能在极端环境下,仍然能够通行的机器人。
据主办方介绍,他们盼望参赛团队在四个领域推动机器人技术的边界:移动性(如何迅速移动)、感知(如何理解外界)、网络(把数据传回服务器)和自主权(机器自主决策)。
这场挑战赛的规则是,参赛团队要搜索、检测比赛场地,找到并定位主办方设置的 10 到 30 件物品的精确位置,这些物品可能包括人体模型、门、电动泵、阀门、背包、灭火器、收音机或手机,以及更多抽象的东西,如煤气泄漏。团队的最终得分主要根据他们可以找到多少物品,以及用时多长。
与此同时,参赛人员被禁止进入隧道,所有的工作必须要有参赛的机器人完成。标记精度在 5 米以内,被认为完成了定位,能获得积分。
要想取得比赛的成功,还是非常有难度的。因为涉及到隧道、城市、洞穴等场景,因此就需要一个整体解决方案,来实现能力的相对平衡。举个简单例子,机器人需要足够小巧才能通过狭窄通道,但它又需要携带足够大的传感器和计算机,来为自己测绘、导航和作出自主决策;另外,在动力系统方面,机器人需要更加节能,才能在极端环境中行驶数公里,但自主决策和测绘都需要很大的电力需求。
对于这场比赛,官方的称呼是「地下挑战赛」,类似铁人三项比赛,不是要找到最强的游泳、跑步和自行车运动员,而是要三项综合成绩最好的人。很多人觉得这种观点过于委婉,更应该把它称为「机器人死亡挑战赛」或「机器人奥运会」。
要真正理解这次挑战赛,需要简单回顾一下整一个完整的过程。据了解,2019 年 8 月,来自 8 个国家的 11 支机器人团队,汇集在美国匹兹堡的一个矿洞,这是第一次隧道比赛(Tunnel Circuit)的场地。与团队一起出现的,还有 20 架无人机、64 架地面机器人和一架名为 Duckiefloat 的自主飞艇。
大部分团队的策略,是先派出机器人侦察、探测环境,然后根据场景和机器人性能,选择正真适合的机器人完成定位任务。在比赛最开始时,情况还都很顺利。但意外很快发生,通信成了这次比赛的最严重的问题。就在机器人转过矿洞第一个拐角的时候,许多团队失去了与机器人的联系,因为无线电波无法穿透坚硬的岩石。
随后,时间很快来到了 6 个月后,第二场比赛(Urban Circuit)来到了西雅图附近的萨索普核电站。这个核电站始建于 1977 年,建设完成 80% 的时候,政府决定不再投入资金,这个核电站也成了废弃项目。如今,它成为此次挑战赛的场地。
如果说,在隧道挑战赛中,通信是一个巨大的挑战。那在这次城市地下赛道中,通讯已经不是什么大问题。参赛团队进行了升级和迭代,使用可部署的网络节点建立了网状网络。机器人在前进的过程中,每隔一段距离就会放置一个小的通讯机器人,然后它会自行建立起网络节点,这样就可以在通讯范围之外进行长时间的工作。
通信问题解决了,但低温成了问题。当时,废弃核电站内的温度是-4 摄氏度,甚至比室外(2 摄氏度)还要低。所以,参赛的团队人员和机器人,都无法长期在比赛场地逗留太久,比赛结束需要立即转移到温暖的地方。
最终,CoSTAR 依靠更好的性能和表现,在城市地下巡回赛中,总共获得 16 分排名第一,比排名第二的 Explorer 高出 5 分,CTU-CRAS-NORLAB 团队获得第三名。
第三场是洞穴巡回赛,原本要在 2020 年秋季举办,但因为 COVID-19 被迫取消。所以,这场赛事直接跳到了 2021 年 9 月的决赛,地点是在路易斯维尔巨型洞穴,这是一个非常有挑战性的场地。整个洞穴大约有 400 万平方英尺(约 37 万平方米),它的特点是结合了 DARPA 设计的三个场景,有不规则通道和大型洞穴系统,还具有复杂布局的地下结构。
这时,参赛队伍已经从最初的 11 支,减少到 8 支。对所有的参赛队伍来说,自主性是决赛的最大挑战。因为比赛场地不允许团队人员进入,每支团队只有一个人可以对机器人进行远程操控,所以让机器人自行决定去哪里,如何去哪里,将是赢得比赛的关键。
在决赛结束时,CERBERUS 和 CSIRO Data61 两支队伍都发现了 23 件物品。因为用时更少,CERBERUS 团队赢得最终的决赛冠军,拿走了 200 万美元奖金,CSIRO Data61 则获得第二名。
回顾机器人地下挑战赛的三年间,应该是梦想照进现实的三年。CSIRO Data61 团队负责人 Navinda Kottege 在接受媒体采访时曾表示,这次挑战赛最有价值的地方在于,DARPA 刚开始知道机器人并没有这种能力,但要求三年之后,形成一支存在竞争力的机器人团队。
最初的想法,也确实变为了现实。在挑战赛开始之前,他们团队确实有一些很炫酷的技术,但没有机器人系统能可靠地工作一个小时或者更长;但三年之后,他们能够部署机器人,让他们自主地去做一些任务,然后小组成员去做自己手中的工作,这是非常大的进步。
与此同时,这次挑战赛也带来了很多技术层面的惊喜,可能会引领机器人的发展。在这次系列赛中,参赛团队带来了很多形态的机器人,包括六足仿蜘蛛机器人,四轮车型机器人、履带坦克型机器人、飞行机器人等。其中,轮式机器人提供了最可靠的机动性,无人机可以探索一些较大的洞穴。
但最令人印象非常深刻的是 CERBERUS 团队的四足机器人 ANYmal C,在比赛中表现可靠,即便遭遇碰撞也能保持稳定,完成了团队的大部分工作。
这款机器人是由瑞士 ANYbotics 公司打造,有点像一只大型犬,重量在 100 斤左右,配备了摄像头、3D 传感器,包括用于 3D 绘图和同步定位和映射(SLAM)的激光雷达,可以执行搜救、检查等任务。移动速度上,它能够达到 1 米/秒,还能轻松处理 20 度的斜坡和 45 度的楼梯,以及跨越 25 厘米的空隙,通过仅有 60 厘米的通道。
更重要的是,ANYmal C 不有必要进行艰苦的建模过程,以及危险且高成本的实地测试,就可以应对现实世界复杂的地形地貌。那它是怎么达到的呢?
据团队负责的人介绍,在复杂的地形和无法准确探测环境的情况下,机器人必须依赖本体感受(proprioceptive)——在高时间分辨率下感测其自身的身体形态。
为此,瑞士 ANYbotics 公司提出了一种稳健的控制器。这种控制器仅使用联合编码器和惯性测量单元的本体感受度量,这是腿式机器人上最耐用最可靠的传感器。有了新型控制器的加持,这些机器人能轻松翻越溪流、草地、雪地、碎石坡等富有挑战的场景。
同时,这个控制器由一种神经网络策略驱动,在模拟环境中进行训练。虽没任何现实世界的数据和精确的地形模型,但控制器仍然能克服野外的各种不规则地形。研究人员还强调说,「我们的系统能穿越几乎所有地形,而且一次都没有摔倒。」
除此之外,研发人员还引入了一些新的方法:首先,在模型上,ANYbotics 公司并没用当前主流的的多层感知器(MLP),而是使用了序列模型,特别是感受状态的时间卷积网络(TCN);其次,是关于特权学习(privileged learning)。新模型在训练中分为两个阶段,首先训练教师策略,该策略可以访问特权信息,即对地面的真实了解和机器人与之的接触;随后教师指导纯本体感受的学生控制器学习,后者仅使用机器人本身可用的传感器信息。
此外,这项研究中提到的方法并没有用到摄像头、激光雷达或接触式传感器信息,只依赖本体感受传感器信号(proprioceptive sensor signal)来提高控制策略在不同地形中的适应性和稳健性。
除了四足机器人,高精度的测绘地图,也是这个挑战赛让人惊喜的地方。在此次挑战赛中,CSIRO data61 团队虽然排在第二位,但他们的机器人测绘得到的地图,与 DARPA 的线%。
据了解,DARPA 官方的地图,是邀请了专业的技术人员,使用了非常昂贵的设备,花费了 100 个小时进行专业测绘得来。但 CSIRO data61 团队,只用了不到一个小时内,得到的结果就跟官方地图接近。这背后的技术,着实让所有人都很吃惊和好奇。
据了解,在 CSIRO data61 团队背后,有一套叫 Wildcat 的自主机器人的研发平台和工业应用的商业化解决方案。据团队负责人曾介绍说,Wildcat 使用非线性优化算法,将来自机器人传感器的 3D LiDAR(光检测和测距)数据,实时转换为高度详细和准确的环境地图,同时为机器人控制提供更新速率的姿态信息。
机器人可以实时共享地图片段,以帮他们保持对环境变化的认识,并探索新的领域。这使他们可以轻松地将不同的机器人平台集成到他们的车队中。
Wildcat 利用 CSIRO 十多年的 SLAM 研发经验,该技术与 IMU(惯性运动单元)和 LiDAR 传感器结合使用,可选择添加其他传感器,如化学、放射、气体、GPS 和 Wi-Fi。
目前,Wildcat 解决方案慢慢的开始商业化,无人机公司 Emesent 是其第一个客户,同时它还与其他几家公司合作。
几年前,波士顿动力在 YouTube 上传的机器人视频,捧红了旗下的双足机器人和四足机器狗。但是,即便成为了「网红」,波士顿动力辗转于谷歌、软银和现代汽车的命运,也折射出机器人产业的举步维艰。
最近两年,宇树科技等国内创业团队将四足机器人价格做到了万元区间,而小米等巨头公司也开始纷纷押注机器人赛道,能够准确的看出机器人慢慢的变成了一个新的风口。但毋庸置疑的是,虽然机器人的价格已不再「高不可及」,但是其使用场景依然局限于安保等固定场景。
DARPA 机器人挑战赛虽然考验的是机器人在极端环境中的搜寻和施救能力,但正像 15 年前的无人驾驶大赛催生了无人驾驶赛道,机器人大赛中所锻炼出的地形扫描、制图和运动能力,或将很快应用到市面可见的机器人产品中,极大拓展机器人的应用场景,并最终加快机器人向消费电子科技类产品类别的过渡步伐。
本文转载自“极客公园 ”,原标题《这群极客,在地下参加了一场「机器人死亡挑战赛」》。
为分享前沿资讯及有价值的观点,太空与网络微信公众号转载此文,并经过编辑。
部分图片难以找到原始出处,故文中未加以标注,如若侵犯了您的权益,请第一时间联系我们。
编辑委员:曹志刚、陈嵩辉、邓中亮、荆继武、景贵飞、郎燕、刘进军、刘天雄、宁振波、秦智、汪春霆、吴季、徐小舒、阎丽娟、赵敏、肇启明、周建华、朱铎先
商务合作;展览展厅设计、企业VI/CI及室内设计、企业文化建设及品牌推广;企业口碑传播及整体营销传播等,请加微信:
...