特斯拉Tesla Optimus人形機械人「入工廠打工」 動作精確度驚人

撰文:機器之心
出版:更新:

特斯拉人形機械人又解鎖新技能了!

日前,Tesla Optimus官方發布了新的demo 視頻,展示了二代Optimus人形機械人的最新進展。這次,Optimus開始進廠打工了,在特斯拉電池工廠學會了分裝電池,並且比以前走得更快更遠更穩了。讓我們先一睹Optimus的最新技能和訓練細節。

點圖放大瀏覽Tesla Optimus照片:

+29

現在,Optimus的端到端神經網路經過訓練,能夠對特斯拉工廠的電池單元進行準確分裝。Optimus在機械人的FSD電腦上即時運行,而僅依靠2D相機、手部觸覺和力傳感器。 Optimus利用它的腿保持平衡,同時網路驅動整個上半身。在插入過程中需要非常精確的動作,且容錯率很低,神經網路會自動定位下一個空閒插槽。 Optimus還能從故障中自主恢復。

Optimus的訓練資料是透過人類遠端操作收集,並針對各種任務進行了擴展。Optimus在工廠進行測試,人工干預率持續下降。當然,Optimus現在可以在定期繞著辦公室行走,不僅走得更快,走的距離也越來越遠了。

對此,特斯拉Optimus(Tesla Bot)工程師Milan Kovac對Optimus的更多訓練細節進行了解讀。在過去的幾個月裡,特斯拉出色的製造團隊製造出了更多的機械人,以便進行研究並收集人工智慧數據。團隊訓練並部署了一個神經網絡,讓Optimus開始執行有用的任務,例如從傳送帶上撿起電池單元並將它們精確地插入托盤中。這個神經網路完全端到端運行,這意味著Optimus只消耗來自機械人2D攝影機的影片以及板載本體感受器上的數據,並直接產生關節控制序列。Optimus完全在機械人的嵌入式FSD電腦上運行,並由板載電池供電。這樣的設計使得單一神經網路可以透過添加更多樣化的資料到訓練過程中來執行多個任務。

【延伸閱讀】瘋傳沙特「痴漢機械人」公然摸美女記者屁股 算否鹹濕意外掀激辯(點圖放大瀏覽):

+3

雖然目前Optimus還不完美,速度還有點慢,但我們看到了越來越高的成功率和越來越少的失誤。特斯拉還訓練Optimus從失敗案例中恢復,並看到了自發性的校正發生。特斯拉已經在一家工廠部署了幾台Optimus人形機械人,它們每天都在真實的工作站上進行測試,並且持續改進。團隊正在進行進一步的工作,以使Optimus移動更快,並應對更惡劣的地形,同時不犧牲它的人性化特性。團隊還將專注於可重複性、訓練神經網路處理動態校準和機械人之間的微小差異。很快會有更多的更新。

此外,輝達NVIDIA資深研究科學家、AI Agents負責人Jim Fan對Optimus新影片展現的技能給予了很高的評價。他認為,影片讓我們窺見了人類數據收集的真實場景,這是Optimus最大的優勢。建立這樣的管線需要什麼呢? Optimus做到了以下幾點:

1. Optimus的手是世界上頂級五指靈巧型機械人手之一,它具有觸覺感知,擁有11 個自由度(DOF),相比之下許多競品只有6-7個DOF,並且具有強大的穩健性,能夠在不需要持續維護的情況下承受大量的物件互動。

2. 遠端操作軟體:我們可以看到人類操作員戴著VR眼鏡和手套。設定軟體以實現第一人稱視訊的即時傳輸和精確控制輸出,同時保持極低延遲,這是非常了不起的。人類對於自己動作和機械人動作之間的最微小延遲都非常敏感。 Optimus有一個流暢的全身控制器,可以即時執行人類姿態。

3. 大規模fleet:你需要不只一個機械人來並行收集數據,需要訓練有素的人類每天進行多次輪班(最好全天候),以及一個隨叫隨到的維護團隊,以確保機械人始終處於忙碌狀態。這是學術研究實驗室甚至不會考慮的大量操作複雜性。

4. 任務與環境:弄清楚要遠端操作什麼也同樣重要。目前,大多數此類工作都是由簡報驅動的:收集你想要放入社群媒體影片中的任務資料。但想要解決通用型機械人的問題,我們需要仔細考慮任務和環境的分佈。從影片的43秒到51秒部分,我們可以看到工廠和家居環境,如行動電池、處理洗衣物、將日常物品分類放入貨架。

【延伸閱讀】Mercedes-Benz平治將起用「機械人搬運工」 製造商為NASA夥伴(點圖放大瀏覽):

+24

這是一個開放性的研究問題:如果你只有預算來收集1000個任務的訓練數據,你會選擇什麼來最大化技能轉移和泛化呢?結論:遠端操作是解決人形機械人問題的必要條件,但不足以充分解決問題。它從根本上來說無法擴展。

在評論區,馬斯克(Elon Musk)預告了Optimus人形機械人手部的最新目標,在今年稍後將擁有22 自由度(DoF)。這就更讓人期待一波了。

先前,據馬斯克在財報電話會議上透露,特斯拉Optimus人形機械人可能會在今年年底擁有完成「有用的工廠任務」的能力,並計劃今年年底前在自家工廠率先使用。同時特斯拉有可能在2025年底前對外銷售Optimus。

【延伸閱讀】美國師奶宣布「和AI聊天機械人結婚」:一生從沒這樣愛過一個人(點圖放大瀏覽):

+27

特斯拉人形機械人「進化史」

特斯拉人形機械人最早要追溯到2021年8月的「特斯拉AI日」活動上,當時馬斯克首次透露了要造人形機械人(Tesla Bot)的設想。這款人形機械人的身高大概是1.72米,重約112斤,身材勻稱,還帶有一張面部螢幕,能夠以約8公里/ 小時的速度移動。

2022年10月,這一年的「特斯拉AI日」上,Optimus人形機械人首次亮相。彼時,它還不能做跳舞等花式表演。機械人工作時的耗電量是500W,重量達73公斤,手動的自由度有27個。不過,在Demo演示中,Optimus展示了其搬箱子、澆花、在特斯拉超級工廠工作的畫面。

2023年5月,經過半年多的蟄伏,特斯拉Optimus終於具備了流暢行走、抓取物體的能力。2023年9月,特斯拉Optimus再次進化,可以自主對物體進行分類了,亮點在於神經網路完全端到端訓練:輸入影片、輸出控制。閒暇之餘,它還能做瑜珈消遣。2023年12月,Optimus第二代到來,讓人的確看到了電影《機械公敵》裡的樣子了。

隨著新影片的發布,特斯拉人形機械人的進步速度再次令人驚嘆。

【本文轉自「機器之心」,微信公眾號:almosthuman2014】