作者 | 周倩 編輯 | 袁斯來 人形機(jī)器人并不是什么新風(fēng)口,在它因?yàn)锳I再次進(jìn)入人們視野之前,曾一度被投資者打入冷宮。 不過,特斯拉的人形機(jī)器人是個(gè)例外,其人形機(jī)器人Optimus(擎天柱)從誕生之初就牢牢吸引行業(yè)和資本的目光,每一次動(dòng)態(tài)更新也攪動(dòng)了大洋彼岸中國機(jī)器人產(chǎn)業(yè)鏈上市公司的股價(jià)漲跌。 盡管今年的特斯拉AI day還未正式定檔公布,但Optimus時(shí)隔幾個(gè)月又有新動(dòng)態(tài),特斯拉已于近日在其官方賬號通過視頻展示更新。 馬斯克對該則視頻的評論是“Progress”(進(jìn)步)。這個(gè)詞倒是所言不虛,相比上一次Optimus的露出,這次Optimus在分類操作和平衡控制方面的表現(xiàn)已經(jīng)十分接近人類的水平??梢哉f在不到半年的時(shí)間里,Optimus的迭代速度十分可觀。 特斯拉發(fā)布Optimus新視頻,圖片來自twitter視頻截圖 今年以來,隨著大模型的迭代升級,智能泛化能力的加強(qiáng)使通用機(jī)器人成為可能,人形機(jī)器人也由此炙手可熱。賽道當(dāng)中的各玩家也紛紛推出自己的人形機(jī)器人。 就在上個(gè)月的世界機(jī)器人大會(huì)上,十余款人形機(jī)器人集中亮相,去年36氪獲悉有入局人形規(guī)劃的追覓,也展出了自己的通用人形機(jī)器人。隨后,備受矚目的天才少年“稚輝君”也在上海,作為智元機(jī)器人的CTO和首席架構(gòu)師,發(fā)布了一款名為“遠(yuǎn)征A1”的人形機(jī)器人。 2023年7月6日,上海,2023世界人工智能大會(huì),特斯拉帶來擎天柱機(jī)器人。馬斯克在開幕式連線時(shí)預(yù)言“未來機(jī)器人將多于人類。” 從上世紀(jì)就出現(xiàn)并一次次進(jìn)化升級至今的人形機(jī)器人來說,越來越像人是各家不約而同的追求,形態(tài)各異的比拼下,核心還在于軟硬件能力的雙重結(jié)合下,人形機(jī)器人究竟能完成哪些任務(wù)操作?能進(jìn)入到哪些場景當(dāng)中實(shí)現(xiàn)什么樣的效用? 而除了技術(shù)本身,人形機(jī)器人行業(yè)還面臨一個(gè)躲不開的疑問:人形機(jī)器人距離量產(chǎn)還有多遠(yuǎn)?或許今年特斯拉 AI Day上,Optimus能給出回答。 Optimus的新能力特斯拉最新發(fā)布的時(shí)長1分17秒的視頻,通過擎天柱能夠完成的幾個(gè)動(dòng)作主要展示了Optimus的視覺感知及運(yùn)動(dòng)控制方面的進(jìn)化,但并未拆解具體的技術(shù)細(xì)節(jié)。 它可以自主對物體分類,并且不受人為干擾的影響;還可以單腿站立,同時(shí)雙臂和另一條腿完成相應(yīng)的動(dòng)作,這些都離不開硬件控制和軟件算法的雙重能力。 僅憑借視覺和關(guān)節(jié)位置編碼器,Optimus就可以在空間中精準(zhǔn)定位自己的肢體,實(shí)現(xiàn)肢體校準(zhǔn),這意味著人形機(jī)器人可以根據(jù)物理環(huán)境的變化和需要來調(diào)整,更準(zhǔn)確高效地完成任務(wù)操作。 具體來看,通過純視覺輸入,Optimus能夠以正常的速度拿起積木,并能按照藍(lán)、綠兩類顏色正確分類。除此之外,在對面發(fā)生人為移動(dòng)積木的動(dòng)作時(shí),Optimus依舊能以自身原本的節(jié)奏順利完成任務(wù),且在積木擺放出錯(cuò)時(shí),自主調(diào)整至正面朝上,完成糾錯(cuò)。僅僅從展示視頻看,Optimus表現(xiàn)出的智能讓人驚訝。 這一能力來自于特斯拉自動(dòng)駕駛技術(shù)部分中的端到端神經(jīng)網(wǎng)絡(luò)訓(xùn)練,特斯拉官方也對這一訓(xùn)練的過程作了簡要闡釋:視頻信號輸入,控制信號輸出。 特斯拉的解釋引發(fā)外界的一系列拆解。中信證券給出了一個(gè)解釋,盡管人形機(jī)器人與汽車在輸入視覺信息方面存在一定差異,但特斯拉基于V12自動(dòng)駕駛的算法體系同時(shí)應(yīng)用于人形機(jī)器人及汽車是可行的。而且,它還有利于加速提升識別算法的泛化能力。 值得注意的一個(gè)細(xì)節(jié)是,Optimus在完成物體拾放時(shí),并未有任何明顯的首部姿勢調(diào)整動(dòng)作,靈巧手更像是以日常習(xí)慣的動(dòng)作完成抓取和擺放。英偉達(dá)高級 AI 科學(xué)家、斯坦福大學(xué)博士 Jim Fan也在其個(gè)人社交平臺表示,Optimus的靈巧手在日常工作中將會(huì)表現(xiàn)得更加出色。 平衡控制方面,相比于股東大會(huì)時(shí)還略顯遲疑的自由行走,如今的Optimus在靜態(tài)運(yùn)動(dòng)狀態(tài)下,能夠?qū)崿F(xiàn)單腿支撐。雙臂和另一只腿配合,能做基礎(chǔ)的瑜伽拉伸工作,同時(shí)軀干并未出現(xiàn)絲毫搖擺的情況。不過,至于行走跑動(dòng)以及更復(fù)雜運(yùn)動(dòng)狀態(tài)下的平衡穩(wěn)定性,還有待更多的展示露出。 人形機(jī)器人的進(jìn)化之路特斯拉對Optimus傾注了不少資源,是它面向未來的重要投資,馬斯克甚至說:Optimus將占“特斯拉長期價(jià)值的大部分”。 Optimus進(jìn)展稱得上迅速。這臺機(jī)器人首次進(jìn)入公眾視野,是在2021年的首屆特斯拉AI Day上,當(dāng)時(shí)配合馬斯克十分鐘演講的Optimus還僅是幾張概念圖。 在去年AI Day,Optimus正式露面。第一代Optimus在外殼相對完備的狀態(tài)下,還需要三名工作人員抬出,在臺上招手致意,運(yùn)動(dòng)表現(xiàn)看起來甚至不如去年首次走到臺上和雷軍互動(dòng)的小米人形機(jī)器人“鐵大”。 而今年5月,Optimus已經(jīng)能夠自主行走、完成周圍環(huán)境識別記憶、緩慢拿取和放置物體等。到現(xiàn)在,Optimus顯然變得更“靈活”了,其分類、拿取物體的速度已經(jīng)能和正常人類保持一致。 時(shí)隔一年,相比于運(yùn)動(dòng)方面更勝一籌、能跑酷能翻跟頭的波士頓動(dòng)力Atlas來說,Optimus在任務(wù)操作方面的先進(jìn)性已初露鋒芒??梢哉f,比起運(yùn)動(dòng)神經(jīng),它顯露出更多“智慧”。 這在很大程度上得益于特斯拉對其自動(dòng)駕駛技術(shù)的復(fù)用。它一方面加快了人形機(jī)器人的技術(shù)迭代速度,而且,馬斯克曾表示,機(jī)器人所采用視覺算法、計(jì)算芯片、電池均與特斯拉汽車產(chǎn)品線共用,可以獲得比其他類人型機(jī)器人更好的成本控制,這在量產(chǎn)落地上更有劃時(shí)代的意義。 根據(jù)馬斯克的設(shè)想,Optimus 的目標(biāo)是替代人類完成重復(fù)勞動(dòng)、危險(xiǎn)操作等工作,以智能助手的角色投入生產(chǎn)中。它將首先在特斯拉工廠做些移動(dòng)搬運(yùn)、零部件裝配等工業(yè)級操作,之后可擴(kuò)展至家庭等更復(fù)雜環(huán)境中,成為通用服務(wù)機(jī)器人。特斯拉也給出很實(shí)際的計(jì)劃,在特斯拉第二季度財(cái)報(bào)電話會(huì)議上,馬斯克表示:現(xiàn)在特斯拉已經(jīng)生產(chǎn)了10臺Optimus,預(yù)計(jì)會(huì)在2024年用于特斯拉工廠。 但Optimus的量產(chǎn)還有不少現(xiàn)實(shí)挑戰(zhàn),馬斯克提到,特斯拉并沒有供應(yīng)商能生產(chǎn)Optimus所需的執(zhí)行器,必須定制。明年Optimus能否投入生產(chǎn),又如何開始商業(yè)化應(yīng)用,今年的特斯拉AI Day或許能給出一些更新的時(shí)間節(jié)點(diǎn)。 |
|