談到移動機器人,你可能會在酒店、醫院、餐飲等服務領域經常會看到機器人的身影。除此之外,波士頓動力公司 (Boston Dynamics) 的網紅機器人,各種摸爬滾打的影片在網路上也吸引了許多目光。
但在一些更複雜、極端的環境下的機器人應用,仍然需要技術層面的深層突破。
這種局面無人駕駛車也曾遇到過。從 2004 到 2007 年,美國國防高等研究計劃署(DARPA,Defense Advanced Research Projects Agency)贊助了無人駕駛挑戰賽。大賽除了捧紅了光學雷達公司 Velodyne,同時也直接催生了此後十幾年火熱的自動駕駛賽道。
遵循同樣的想法,2018 年 DARPA 發起了機器人地下挑戰賽(Subterranean Challenge,SubT),並設置了 500 萬美元的獎金,吸引世界各地的機構和公司的工程師和科學家團隊來參加比賽。
如今,此次持續近三年的系列賽已經落幕,最終 CERBERUS 團隊和 CSIRO Data61 團隊,分別獲得決賽的第一名和第二名。
除了比賽結果,這次挑戰賽更大的價值,在於對現實的映射。回顧這場比賽中遇到的問題和給出的解決方案,可以更深層地瞭解機器人發展的動向,以及加速機器人的普及。
機器人的「死亡挑戰賽」
談起舉辦這次地下挑戰賽的直接契機,DARPA 戰術技術辦公室專案經理 Timothy Chung 表示,這主要考慮到作戰人員的需求,以及先遣應急隊的需求。他們需要在各種地下環境中執行搜索和救援的任務,可能是人口密集的事故、自然災害,也可能是礦山等救援。
同時,在這次挑戰賽的官網,引用了克勞塞維茲在《戰爭論》中的一句話,「戰爭與地形的關係,要求我們具備快速而精準地獲取任何地區地形資訊的能力。」
在比賽場地的選擇上,這次地下挑戰賽選取了地下隧道、城市地下、岩洞三個最具挑戰性的場景。在這樣的環境中,機器人將面臨很多極限的情況,比如地形非常複雜,無法使用 GPS,通訊受到限制,能見度低,移動性也受到挑戰等等。簡單說,DARPA 的目標是要尋找能在極端環境下,仍然能夠通行的機器人。
據主辦方介紹,他們希望參賽團隊在四個領域推動機器人技術的邊界:移動性(如何迅速移動)、感知(如何理解外界)、網路(把數據回傳伺服器)和自主權(機器自主決策)。
這場挑戰賽的規則是,參賽團隊要搜索、檢測比賽場地,找到並定位主辦方設置的 10 到 30 件物品的精確位置,這些物品可能包括人體模型、門、電動泵、閥門、背包、滅火器、收音機或手機,以及更多抽象的東西,如瓦斯洩漏。團隊的最終得分主要取決於他們能夠找到多少物品,以及花了多長的時間。
與此同時,參賽人員被禁止進入隧道,所有的工作必須要由參賽的機器人完成。標記精度在 5 公尺以內,被認為完成了定位,能獲得積分。
要想取得比賽的成功,還是非常有難度。因為涉及到隧道、城市、洞穴等場景,因此需要一個整體解決方案,來實現能力的相對平衡。舉個簡單例子,機器人需要足夠小巧才能通過狹窄通道,但它又需要攜帶足夠大的感測器和電腦,來為自己測繪、導航和作出自主決策;另外,在動力系統方面,機器人需要更加節能,才能在極端環境中行駛數公里,但自主決策和測繪都需要很大的電力需求。
對於這場比賽,官方的稱呼是「地下挑戰賽」,類似鐵人三項比賽,不是要找到最強的游泳、跑步和自行車運動員,而是要三項綜合成績最好的人。很多人覺得這種說法過於委婉,更應該把它稱為「機器人死亡挑戰賽」或「機器人奧運會」。
「機器人與地下城」
要真正理解這次挑戰賽,需要簡單回顧一下整個過程。據瞭解,2019 年 8 月,來自 8 個國家的 11 支機器人團隊,彙集在美國匹茲堡的一個礦洞,這是第一次隧道比賽(Tunnel Circuit)的場地。與團隊一起出現的,還有 20 架無人機、64 架地面機器人和一架名為 Duckiefloat 的自主飛艇。
大部分團隊的策略,是先派出機器人偵察、探測環境,然後根據場景和機器人性能,選擇合適的機器人完成定位任務。在比賽最開始時,情況還都很順利。但意外很快發生,通訊成了這次比賽的最大問題。就在機器人轉過礦洞第一個拐角的時候,許多團隊失去了與機器人的聯繫,因為無線電波無法穿透堅硬的岩石。
隨後,時間很快來到了 6 個月後,第二場比賽(Urban Circuit)來到了西雅圖附近的薩索普核電站。這個核電站始建於 1977 年,建設完成 80% 的時候,政府決定不再投入資金,這個核電站也成了廢棄項目。如今,它成為此次挑戰賽的場地。
如果說,在隧道挑戰賽中,通訊是一個巨大的挑戰。那在這次城市地下賽道中,通訊已經不是什麼大問題。參賽團隊進行了升級和反覆運算,使用可部署的網路節點建立了網狀網路。機器人在前進的過程中,每隔一段距離就會放置一個小的通訊機器人,然後它會自行建立起網路節點,這樣就可以在通訊範圍之外進行長時間的工作。
通訊問題解決了,但低溫成了問題。當時,廢棄核電站內的溫度是-4 °C,甚至比室外(2 °C)還要低。所以,參賽的團隊人員和機器人,都無法長期在比賽場地逗留太久,比賽結束立即轉移到溫暖的地方。
最終,CoSTAR 依靠更好的性能和表現,在城市地下巡迴賽中,總共獲得 16 分排名第一,比排名第二的 Explorer 高出 5 分,CTU-CRAS-NORLAB 團隊獲得第三名。
第三場是洞穴巡迴賽,原本要在 2020 年秋季舉辦,但因為 COVID-19 被迫取消。所以,這場賽事直接跳到了 2021 年 9 月的決賽,地點是在路易斯維爾巨型洞穴,這是一個非常有挑戰性的場地。整個洞穴大約有 400 萬平方英尺(約 37 萬平方公尺),它的特點是結合了 DARPA 設計的三個場景,有不規則通道和大型洞穴系統,還具有複雜布局的地下結構。
這時,參賽隊伍已經從最初的 11 支,減少到 8 支。對所有的參賽隊伍來說,自主性是決賽的最大挑戰。因為比賽場地不允許團隊人員進入,每支團隊只有一個人可以對機器人進行遠端操控,所以讓機器人自行決定去哪裡,如何去哪裡,將是贏得比賽的關鍵。
在決賽結束時,CERBERUS 和 CSIRO Data61 兩支隊伍都發現了 23 件物品。因為使用時間更少,CERBERUS 團隊贏得最終的決賽冠軍,拿走了 200 萬美元獎金,CSIRO Data61 則獲得第二名。
啟示和未來
回顧機器人地下挑戰賽的三年間,應該是夢想照進現實的三年。CSIRO Data61 團隊負責人 Navinda Kottege 在接受採訪時曾表示,這次挑戰賽最有價值的地方在於,DARPA 剛開始知道機器人並沒有這種能力,但要求三年之後,形成一支有競爭力的機器人團隊。
最初的想法,也確實變為了現實。在挑戰賽開始之前,他們團隊確實有一些很炫酷的技術,但沒有機器人系統可以可靠地工作一個小時或者更長;但三年之後,他們可以部署機器人,讓他們自主地去做一些任務,然後團隊成員去做自己手中的工作,這是非常大的進步。
與此同時,這次挑戰賽也帶來了很多技術層面的驚喜,可能會引領機器人的發展。在這次系列賽中,參賽團隊帶來了很多形態的機器人,包括六足仿蜘蛛機器人,四輪車型機器人、履帶坦克型機器人、飛行機器人等。其中,輪式機器人提供了最可靠的機動性,無人機可以探索一些較大的洞穴。
但最令人印象深刻的是 CERBERUS 團隊的四足機器人 ANYmal C,在比賽中表現可靠,即便遭遇碰撞也可以保持穩定,完成了團隊的大部分工作。
這款機器人是由瑞士 ANYbotics 公司打造,有點像一隻大型犬,重量在50公斤左右,配備了攝影鏡頭、3D 感測器,包括用於 3D 繪圖和同步定位和映射(SLAM)的光學雷達,可以執行搜救、檢查等任務。移動速度上,它可以達到 1 公尺/秒,還能輕鬆處理 20 度的斜坡和 45 度的樓梯,以及跨越 25 公分的空隙,通過僅有 60 公分的通道。
更重要的是,ANYmal C 不需要進行艱苦的建模過程,以及危險且高成本的實地測試,就可以應對現實世界複雜的地形地貌。那它是怎麼達到的呢?
據團隊負責人介紹,在複雜的地形和無法準確探測環境的情況下,機器人必須依賴本體感受(proprioceptive)——在高時間解析度下感測其自身的身體形態。
為此,瑞士 ANYbotics 公司提出了一種穩健的控制器。這種控制器僅使用聯合編碼器和慣性測量單元的本體感受度量,這是腿式機器人上最耐用最可靠的感測器。有了新型控制器的加持,這些機器人可以輕鬆翻越溪流、草地、雪地、碎石坡等富有挑戰的場景。
同時,這個控制器由一種神經網路策略驅動,在類比環境中進行訓練。雖然沒有任何現實世界的資料和精確的地形模型,但控制器仍然能克服野外的各種不規則地形。研究人員還強調說,「我們的系統可以穿越幾乎所有地形,而且一次都沒有摔倒。」
除此之外,研發人員還引入了一些新的方法:首先,在模型上,ANYbotics 公司並沒有使用當前主流的的多層感知器(MLP),而是使用了序列模型,特別是感受狀態的時間卷積網路(TCN);其次,是關於特許學習(privileged learning)。新模型在訓練中分為兩個階段,首先訓練教師策略,該策略可以存取特許資訊,即對地面的真實瞭解和機器人與之的接觸;隨後教師指導純本體感受的學生控制器學習,後者僅使用機器人本身可用的感測器資訊。
此外,這項研究中提到的方法並沒有用到攝影鏡頭、光學雷達或接觸式感測器資訊,只依賴本體感受感測器訊號(proprioceptive sensor signal)來提高控制策略在不同地形中的適應性和穩健性。
除了四足機器人,高精度的測繪地圖,也是這個挑戰賽讓人驚喜的地方。在此次挑戰賽中,CSIRO data61 團隊雖然排在第二位,但他們的機器人測繪得到的地圖,與 DARPA 的真實地圖相差不到 1%。
據瞭解,DARPA 官方的地圖,是邀請了專業的技術人員,使用了非常昂貴的設備,花費了 100 個小時進行專業測繪得來。但 CSIRO data61 團隊,只用了不到一個小時內,得到的結果就跟官方地圖接近。這背後的技術,著實讓所有人都很吃驚和好奇。
據瞭解,在 CSIRO data61 團隊背後,有一套叫 Wildcat 的自主機器人的研發平臺和工業應用的商業化解決方案。據團隊負責人曾介紹說,Wildcat 使用非線性優化演算法,將來自機器人感測器的 3D LiDAR(光檢測和測距)資料,即時轉換為高度詳細和準確的環境地圖,同時為機器人控制提供更新速率的姿態資訊。
機器人可以即時共用地圖片段,以幫助他們保持對環境變化的認識,並探索新的領域。這使他們能夠輕鬆地將不同的機器人平臺整合到他們的車隊中。
Wildcat 利用 CSIRO 十多年的 SLAM 研發經驗,該技術與 IMU(慣性運動單元)和 LiDAR 感測器結合使用,可選擇添加其他感測器,如化學、放射、氣體、GPS 和 Wi-Fi。
目前,Wildcat 解決方案已經開始商業化,無人機公司 Emesent 是其第一個客戶,同時它還其他幾家公司合作。
幾年前,波士頓動力在 YouTube 上傳的機器人影片,捧紅了旗下的雙足機器人和四足機器狗。但是,即便成為了「網紅」,波士頓動力輾轉於谷歌、軟銀和現代汽車的命運,也折射出機器人產業的舉步維艱。
最近兩年,小米等巨頭公司也開始紛紛押注機器人賽道,可以看出機器人已經成為一個新的風口。但不可否認的是,雖然機器人的價格已經不再「高不可及」,但是其使用場景依然局限於保全等固定場景。
DARPA 機器人挑戰賽雖然考驗的是機器人在極端環境中的搜尋和施救能力,但正像 15 年前的無人駕駛大賽催生了自動駕駛賽道,機器人大賽中所鍛煉出的地形掃描、製圖和運動能力,或將很快應用到市面可見的機器人產品中,極大拓展機器人的應用場景,並最終加快機器人向消費電子產品類別的過渡步伐。
加入電腦王Facebook粉絲團