近日,騰訊自主研發的多模態四足機器人“機器狗 Max”再度得到升級,使其動作、行為都更加接近真實動物。騰訊方面表示,通過將前沿的預訓練AI模型和強化學習技術應用到機器人控制領域,讓這次機器狗 Max的靈活性和自主決策能力得到大幅提升。
【資料圖】
經緯創投合伙人王華東曾表示:“四足機器人憑借優越的靈活性、友好的人機交互能力,及同等地形下更低的成本,在企業應用及普通消費者場景均有良好的前景。”因此,一些初創公司和科技互聯網企業都瞄準了這個賽道。
騰訊如何讓機器狗更聰明
2021年,騰訊正式發布首個軟硬件全自研多模態四足機器人機器狗Max,2022年,第二代四足機器人“Max”發布,這次的三代跟之前相比,關節自由度有了明顯提升。
騰訊Robotics X機器人實驗室通過引入預訓練模型和強化學習技術,可以讓機器狗分階段進行學習,有效的將不同階段的技能、知識積累并存儲下來,讓機器人在解決新的復雜任務時,不必重新學習,而是可以復用已經學會的姿態、環境感知、策略規劃多個層面的知識,并“舉一反三”。
這一系列的學習分為三個階段:
第一階段通過游戲技術中常使用動作捕捉系統,研究員收集真狗的運動姿態數據,包括走、跑、跳、站立等動作,并利用這些數據,在仿真器中構建了一個模仿學習任務,再將這些數據中的信息抽象并壓縮到深度神經網絡模型中。這些模型能夠非常準確地涵蓋收集的動物運動姿態信息,且具有一定的可解釋性。
騰訊Robotics X機器人實驗室和騰訊游戲合作,用游戲技術提升了仿真引擎的準確和高效,同時游戲制作和研發過程中積累了多元的動捕素材。這些技術以及數據對基于物理仿真的智能體訓練以及真實世界機器人策略部署起到了一定的輔助作用。
在模仿學習的過程中,神經網絡模型僅接收機器狗本體感知信息作為輸入,例如機器狗身上電機狀態等。再下一步,模型引入周邊環境的感知數據,例如可以通過其他傳感器“看到“腳下的障礙物。
第二階段,通過額外的網絡參數來將第一階段掌握的機器狗靈動姿態與外界感知聯系在一起,使得機器狗能夠通過已經學會的靈動姿態來應對外界環境。當機器狗適應了多種復雜的環境后,這些將靈動姿態與外界感知聯系在一起的知識也會被固化下來,存在神經網絡結構中。
第三階段,利用上述兩個預訓練階段獲取的神經網絡,機器狗才有前提和機會來聚焦解決最上層的策略學習問題,最終具備端到端解決復雜的任務的能力。第三階段附加的網絡會獲取與復雜任務有關的信息,例如在游戲中,獲取對手的信息、旗子的信息。此外,通過綜合分析所有信息,負責策略學習的神經網絡會學習出針對任務的高階策略,例如往哪個方向跑動,預判對手的行為來決定是否繼續追逐等等。
上述每一階段學習到的知識都可以擴充和調整,不需要重新學習,因此可以不斷積累,持續學習。
機器狗向何處去
20世紀90年代后,美國和日本公司開始進行商業化足式機器人的嘗試,如波士頓動力、本田、豐田、索尼等企業。美國波士頓動力學公司于2005年研發了動力平衡四足機器人Big Dog,作為阿富汗戰場增兵計劃的一部分。
進入21世紀,國內也開始鉆研四足機器人,2015年到2020年,宇樹科技、云深處科技、蔚藍科技公司等相繼成立,在各種科技展會甚至春晚都能見到機器狗的身影。隨著軟硬件技術的逐步成熟以及成本下降,四足機器人靈活性及性價比持續提升,普及度有所提高。
敦鴻資產合伙人俞文超表示:“機器人是 AI、算力、IoT、底層硬件等各種技術的集大成者,這一未來萬億級賽道的星辰大海才剛開啟。四足機器人作為 ‘新物種’,除了 2B 應用外,有望成為最早在 C 端普及的機器人之一。”
我們熟悉的消費級四足機器人,更多地強調陪伴功能,如果能普及,未來將會看到大量“遛機器狗”的賽博場景。這種四足機器人的價格普遍在萬元以上,目前仍是昂貴的電子玩具,受眾往往是極客和高凈值人群。
事實上,資本看好的是四足機器人背后服務、工程、安防、制造、養老等巨大的市場。以陪護方向為例,導盲機器狗可能成為未來面向C端的主要產品。據統計,我國約有1730萬盲人,機器狗相較于傳統導盲犬有更強的交互能力,能夠與盲人群體更好地溝通。提前布局市場,才能在商業化浪潮來臨之前站穩腳跟。
而商用的四足機器人同樣面臨成本制約,但勝在應用場景較為豐富。相較于輪履式機器人,四足機器人更為靈活敏捷,行動速度、越障能力更為出色;相較于人形機器人,其平衡能力更好,設計、生產、維護更為簡單,多重優勢使其成為了世界多個科技公司研發的熱點。
除了部分場景,四足機器人的實際落地還面臨一些困難。比如過于復雜的工業級別的應用,四足機器人尚無法應付;續航時間較短、充電時間過長,也是一大短板。云深處科技方面以電力巡檢為例,認為傳統機器人巡檢方案的應用場景仍然有一定限制,例如不能實現全域檢查,復雜環境仍需人工干預等。正如賽智伯樂合伙人袁智勇所言:“做一個能動的四足機器人是簡單的,但是應用到環境惡劣的工業和行業場景中,需要極高的技術壁壘和行業積淀。”
2021年,國內四足機器人也涌入了科技互聯網圈的競爭者。8月,小米發布了首款仿生四足機器人“CyberDog”;同年9月,小鵬則發布了全球首款可騎乘智能機器馬。但是并沒有解決太多痛點,更多的是在該賽道提前布局“占坑”。
波士頓咨詢公司預計,2030年,全球機器人市場規模將達到1600億至2600億美元。而騰訊機器狗的最新迭代,已經將前沿的預訓練AI模型和強化學習技術應用到機器人控制領域,為機械機器人向智能機器人加速轉變添了一把火。
談到四足機器人未來的發展,宇樹科技創始合伙人陳立認為,大模型的快速迭代,對四足機器人的發展也有促進作用。“原來在四足機器人身上的語音交互比較簡單,基本上是單句命令式的語音操控,沒法做語言語音背后的一些識別和算法的優化。現在出了ChatGPT這樣的產品,意味著我們可以通過大模型的賦能,跟四足機器人實時溝通,令其能更好更快地理解人類意圖。這樣的話,現在有大模型賦能之后(四足機器人)會更智能易用。”
責任編輯:
責任編輯:Rex_17