小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

特斯拉AI Day 2022全解讀:能走會動的Tesla Bot,DOJO超算明年量產(chǎn)、還有FSD新...

 cpu001 2022-10-01 發(fā)布于廣東
每天打卡閱讀
更深刻理解汽車產(chǎn)業(yè)變革
————————
出品:電動星球 News
作者:毓肥

幾個小時前,特斯拉正式舉辦了 2022 AI Day,一場全球汽車、人工智能、信息科技行業(yè)翹首以待足足 13 個月的發(fā)布會。

圖片

嚴(yán)格意義上 AI Day 不像是「發(fā)布會」,而是「交流會」——馬斯克本人也在推特上說,「此活動旨在招聘 AI 和機(jī)器人工程師,因此技術(shù)含量很高」——換句話說,這是馬斯克的高山流水,為特斯拉的鍾子期而開。

不過這并不妨礙我們以比較輕松的視角,記錄下這場科技狂歡。因為特斯拉團(tuán)隊幾乎 100% 實現(xiàn)了去年的承諾,在本屆 AI Day 上帶來了以下技術(shù)成果:

不再需要群演的真·Tesla Bot 機(jī)器人原型機(jī);
不再停留在 PPT 的 DOJO POD 人工智能超級計算機(jī);
FSD 技術(shù)新進(jìn)展,等等。

當(dāng)然,即使我們會盡力寫得簡單點,今天的文章依然會相對硬核。趁著國慶假期,建議大家可以慢慢看,下面馬上開始。

一、Tesla Bot 原型機(jī)

Optimus 它來了!

圖片

13 個月前還需要群演的 Tesla Bot,今天正式以原型機(jī)的形式出現(xiàn)——原型意思是它還沒穿衣服(外殼)。

圖片

原型機(jī)的樣子比 PPT 里面明顯更粗放,線束、促動器等零件堆砌略顯凌亂。但好消息是,Tesla Bot 原型機(jī)已經(jīng)可以走路、打招呼,雙手可以完整舉過頭頂。

圖片

在特斯拉的演示視頻里,Optimus 已經(jīng)可以做一些簡單的工作,比如搬運(yùn)箱子、澆花等等。

圖片
圖片
圖片

但更重要的可能是這個畫面:Optimus 眼中的世界,通過純視覺發(fā)現(xiàn)并分析周邊的一切,然后識別出自己的任務(wù)對象。

圖片

事實上 Optimus 不是不能裝上外殼,但出于工程原因,帶外殼版本截止到發(fā)布會當(dāng)天還不能自如地走路(原因后面再解釋),只能簡單揮舞一下手臂。

圖片

裝上外殼之后我們發(fā)現(xiàn),更接近量產(chǎn)版的 Optimus,變得更胖了——現(xiàn)在它重 73 公斤,比去年 PPT 版「增重」超過 20%,整個「人」圓了一大圈。

圖片

更接近量產(chǎn),也意味著 Optimus 更高階的參數(shù)也可以公布了:100W 靜坐功耗、500W 快步走功耗、超過 200 檔的關(guān)節(jié)自由度,光手部自由度就有 27 檔。

圖片

另外,Optimus 的大腦由單塊 FSD Chip 組成,意味著算力應(yīng)該是 HW3.0 的一半(72TOPS);電池則是 52V 電壓、2.3kWh 容量、內(nèi)置電子電氣元件的一體單元。

說完數(shù)字,是時候聊聊 Optimus 的研發(fā)邏輯了。

1. 汽車化

馬斯克說過「當(dāng)你能解決自動駕駛,你就能解決現(xiàn)實世界中的人工智能」。這句話點破了特斯拉研發(fā) Optimus 的方法論:大量借鑒汽車研發(fā)經(jīng)驗。

比如借鑒汽車碰撞模擬軟件,為 Optimus 編寫「跌倒測試」軟件。

圖片

再比如利用汽車大規(guī)模零件的生產(chǎn)經(jīng)驗,為 Optimus 挑選盡可能保證成本 效率的原材料?!肝覀儾粫锰祭w維、鈦合金這樣的原材料。因為它們雖然很優(yōu)秀,但像肩膀這樣的易損部位,制造和維修成本都太貴了」。

圖片

除此以外,制造 Optimus 的中心思想,也基本和智能汽車相當(dāng):減少線束長度、計算和電子控制單元中心化,等等。

2. 仿生學(xué)

既然是類人機(jī)器人 humanoid,設(shè)計自然要借鑒人類仿生學(xué)。

圖片

特斯拉用了幾個例子解釋 Optimus 的仿生學(xué),首先是膝關(guān)節(jié)。特斯拉表示 Optimus 的關(guān)節(jié)希望盡量復(fù)刻生物學(xué)上的「非線性」邏輯,也就是貼合膝關(guān)節(jié)直立到完全彎曲時的受力曲線。

圖片

為此,Optimus 的膝關(guān)節(jié)使用了類似于平面四桿機(jī)構(gòu)的設(shè)計,最終發(fā)力效果會更接近人類。

圖片

緊接著,我們創(chuàng)造人類文明的雙手,才是 Optimus 類人之路更大的 boss。

圖片

Optimus 光手掌區(qū)域就用了 6 個促動器,具有 11 檔的自由度。擁有自適應(yīng)的抓握角度、20 磅(9 公斤)負(fù)荷、工具使用能力、小物件精準(zhǔn)抓握能力等等。

圖片

此外,Optimus 的手掌用的是「non-backdrivable」無法反向驅(qū)動的指尖促動器。學(xué)術(shù)界的看法是,這樣的促動器可以提升在「開放環(huán)境」下的性能。

最后是讓 Optimus 學(xué)著像人類一樣走路——這里用到的仿生學(xué)設(shè)計叫做「運(yùn)動重心控制」。

圖片

為什么有外殼的  Optimus 還不會走?其中一個原因就是重量變了,運(yùn)動重心控制算法需要重新調(diào)試。

圖片

事實上,Optimus 不僅要做到會走路,還要做到別摔倒。所以它不僅需要控制走路的重心,還要穩(wěn)住受到外力(比如推搡)時的隨機(jī)動態(tài)重心。

圖片

訓(xùn)練 FSD 用到的神經(jīng)網(wǎng)絡(luò)和在線仿真模擬,這次在 Optimus 身上大顯身手。路徑規(guī)劃、視覺融合、視覺導(dǎo)航等等熟悉的名詞都被「灌輸」到 Optimus 腦子里。

圖片

這樣的努力下,Optimus 今年 4 月邁出了它的第一步;7 月份解鎖了骨盆活動;8 月走路時可以擺手臂了——發(fā)布會前幾周,實現(xiàn)了腳趾離地的類人行走動作。

圖片

3. 「肌肉」

我們通過結(jié)締組織包裹著的肌肉完成運(yùn)動,機(jī)器人的「肌肉」則叫做促動器 actuator。

圖片

如上圖所示,橙色部分均為 Optimus 的促動器,這些促動器也都是特斯拉完全自研的。

圖片

特斯拉為  Optimus 從力度大小的角度,設(shè)計了 6 種各自獨特的促動器——這其實是很小的數(shù)字,業(yè)界平均是 20-30,甚至 50 種,目的是覆蓋盡可能多的人類活動細(xì)節(jié)。

為什么特斯拉的促動器種類這么少?原因還是 FSD 體系。

特斯拉舉了 28 種人類常見活動,比如抬舉手臂、彎曲右膝等。通過分析這些活動反饋的云數(shù)據(jù),找出各類運(yùn)動的相對共同點,然后就可以盡量減少專門設(shè)計促動器的種類。

圖片

雖然只是輕描淡寫的一張 PPT,但我認(rèn)為促動器從 50 種減少到 6 種,意義實際上遠(yuǎn)大于借鑒特斯拉電機(jī)經(jīng)驗的促動器本體——因為它代表著數(shù)據(jù)為王的新工業(yè)時代。

不過促動器種類大幅度減少,也意味著 Optimus 前期的實際效果可能會沒有那么「類人」,當(dāng)然還是得等最終交付了。

最后來說一個數(shù)字:2 萬美元(約 14 萬元)。

這筆錢買不到半臺 Model 3,但卻是馬斯克口中 Optimus 的目標(biāo)售價。「它會徹底改變?nèi)祟惿鐣男?,就像無人交通可以徹底改變運(yùn)輸效率」。

二、DOJO 的終極形態(tài)?

本來發(fā)布會的第二部分是 FSD,但那部分過于硬核,我決定先讓大家看點激動人心的數(shù)字。

去年 DOJO 驚艷全世界,但遺憾的是有太多細(xì)節(jié)未公布。D1 芯片是怎么組成 EXA POD 超算系統(tǒng)的?理論性能爆炸,能代表實際應(yīng)用嗎?

這部分,特斯拉舉了大量的數(shù)據(jù),證明自己已經(jīng)是計算領(lǐng)域的新巨頭。

圖片

首先是散熱。

先別發(fā)問號,超算平臺的散熱,一直是衡量超算制造者系統(tǒng)工程能力的重要維度。比如谷歌、華為、英偉達(dá)在公布自家方案的時候,都會花大篇幅講散熱。

DOJO POD 的散熱可以用兩個詞概括:高集成度、高自研率。

圖片

特斯拉在 DOJO POD 上使用了全自研的 VRM(電壓調(diào)節(jié)模組),單個 VRM 模組可以在不足 25 美分硬幣面積的電路上,提供超過 1000A 的電流。

高集成度帶來的問題,是熱膨脹系數(shù) CTE。DOJO 堪稱極限的體積集成率和發(fā)熱,意味著 CTE 稍微失控,都會對系統(tǒng)結(jié)構(gòu)造成巨大破壞(也就是會撐爆)。

圖片

為此,這套自研 VRM 在過去兩年內(nèi)迭代了 14 個版本,最終才完全符合特斯拉對 CTE 指標(biāo)的要求。

目前 DOJO POD 已經(jīng)進(jìn)入負(fù)載測試階段——單機(jī)柜 2.2MW 的負(fù)載,相當(dāng)于 6 臺 Model Y 雙電機(jī)全力輸出。

圖片

解決了散熱,才有資格說集成度。

一個 DOJO POD 機(jī)柜由兩層計算托盤和存儲系統(tǒng)組成。每一層托盤都有 6 個 D1 Tile 計算「瓦片」——兩層 12 片 組成的一個機(jī)柜,就可以提供 108PFLOPS 算力的深度學(xué)習(xí)性能。

圖片

對了,DOJO POD 的供電模組也是 52V 電壓的,Optimus 母親實錘了。

每層托盤都連接著超高速存儲系統(tǒng):640GB 運(yùn)行內(nèi)存可以提供超過 18TB 每秒的運(yùn)算帶寬,另外還有超過 1TB 每秒的網(wǎng)絡(luò)交換。

圖片

為了適配訓(xùn)練軟件以及運(yùn)營/維護(hù),每個托盤還配備了專屬的管理計算中心。

圖片

最終,可以提供 1.1E 算力、13TB 運(yùn)存、1.3TB 緩存的 EXA POD,將于 2023 年 Q1,正式量產(chǎn)——這也是今天發(fā)布會唯一一個有確定日期的特斯拉產(chǎn)品。

圖片

意大利炮有了,能不能轟下縣城?

圖片

特斯拉表示,配合專屬的編譯器,DOJO 的訓(xùn)練延遲,最低可以做到同等規(guī)模 GPU 的 1/50!

最終,特斯拉的目標(biāo)是到 2023 年 Q1 量產(chǎn)時,DOJO 可以實現(xiàn)相比英偉達(dá) A100,最高 4.4 倍的單芯片訓(xùn)練速度——甚至能耗和成本都更低。

圖片

三、FSD 的新進(jìn)化

文章來到這里,大家的手指應(yīng)該已經(jīng)劃了很多次屏幕。這也說明,看到這里依然興致勃勃的你,一定是特斯拉老粉——那就聊點更「無聊」、更硬核的吧。

圖片

篇幅有限,本屆 AI Day 關(guān)于 FSD 的進(jìn)展,我們只聊三個點:Occupancy Network、Training Optimization、Lanes。

1. Occupancy Network

先聊一個概念:矢量圖。做設(shè)計的朋友一定很熟悉,這是一種精度(分辨率)可以做到無限,但占用存儲空間很小的數(shù)字繪圖。

Occupancy Network,就是將 3D 向量數(shù)據(jù)繪制成矢量圖的、 2019 年開始興起的一種三維重建表達(dá)方法。

有意思的是,特斯拉用了最 Occupancy Network 的方式,表達(dá)他們對 Occupancy Network 的應(yīng)用:網(wǎng)格(方塊)化的 3D 模擬。

其實 FSD 眼中的世界并不是這樣 Minecraft 化的,但 Occupancy Network 的本質(zhì)特征,就是用「決策邊界」描繪「物體邊緣」。

圖片

盡管 Occupancy Network 效率很高,但實際訓(xùn)練規(guī)模依然足夠可觀。目前特斯拉公布的數(shù)據(jù)是超過 14.4 億幀視頻數(shù)據(jù),需要超過 10 萬個 GPU 訓(xùn)練小時,實際視頻緩存超過 30PB——而且全程 90℃ 滿負(fù)載。

圖片

二、因此,Training Optimization 訓(xùn)練優(yōu)化尤為重要。

去年 Andrej 公布了特斯拉的千人 in-house 標(biāo)注團(tuán)隊,今年特斯拉的重點,則在于優(yōu)化自動標(biāo)注流程。

圖片


大概總結(jié)一下就是,優(yōu)化過后,訓(xùn)練時視頻幀選取會更智能,同時大幅度減少選取的視頻幀數(shù)量——可以提高 30% 的訓(xùn)練速度。

圖片


另外視頻模型訓(xùn)練時 smol 異步庫文件體積可以縮小 11%,所需的讀取次數(shù)足足縮小到 1/4...最終這套優(yōu)化流程讓特斯拉的 Occupancy Network 訓(xùn)練效率提升了 2.3 倍。

3. 最后聊聊車道線 Lanes。

從 FSD Beta 10.12 開始,幾乎每一版更新,車道線和無保護(hù)左轉(zhuǎn),都是更新日志的第一條。

圖片


為了更準(zhǔn)確高效應(yīng)對車道線,特斯拉這次「編」了一套「屬于車道的語言」。其中包括車道級別的地理幾何學(xué)和拓?fù)鋷缀螌W(xué)、車道導(dǎo)航、公交車道計算、多乘員車輛車道計算等等。
圖片

最終這套「車道的語言」,可以在小于 10 毫秒的延遲內(nèi),思考超過 7500 萬個可能影響車輛決策的因素——而且 FSD 硬件「學(xué)會」這套語言的代價(功耗),還不足 8W。

圖片

四、四十年后,開始圓夢?

寫到這里,我真的很頭疼。

一方面是我們大部分人,都不是這屆 AI Day 的對象——馬斯克眼里只有招聘。另一方面,是現(xiàn)在一家汽車公司的發(fā)布會,對知識面要求實在太高了。

圖片

還是說回馬斯克吧,40 年前的他,還是個每天會看 10 個小時科幻小說的小孩子,沉醉于《銀河系漫游指南》、《基地》、《嚴(yán)厲的月亮》等等。

但正是這些科幻小說,培養(yǎng)了馬斯克冰冷卻又宏大的事業(yè)觀。他會跟你說人類社會生產(chǎn)力的效率可以擴(kuò)大到無限,他會跟你說人口是維系文明的最重要因素。

所以,當(dāng)我們把 52 歲的馬斯克和 12 歲的馬斯克放在一起,你會發(fā)現(xiàn)他倆依然在本質(zhì)上是同一個人。

也正因如此,你看到他如今幾乎涉獵了科幻小說所有最熱門題材的商業(yè)帝國,才會覺得「哦,那很正?!埂?br>

希望明年我們能看到更接近現(xiàn)實的馬斯克童夢吧。

(完)

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多