人工智能落地的野心和現(xiàn)實(shí),顯然還存在著不小的鴻溝。 文 | 彭蘇平 特斯拉不僅僅是一家汽車制造公司,而且是一家科技公司。上周的一場發(fā)布會,讓特斯拉的這種形象更加鮮明。 北京時間8月20日上午,預(yù)熱多時的特斯拉AI日活動如期舉行。特斯拉發(fā)布了FSD(完全自動駕駛)純視覺解決方案、自研AI芯片和Dojo超級計算機(jī),其披露的更多技術(shù)細(xì)節(jié)以及相關(guān)硬件更為快速的技術(shù)迭代,讓業(yè)內(nèi)再次驚嘆“特斯拉的技術(shù)是真的很?!?。 不過,對于長期關(guān)注特斯拉的人而言,無論是純視覺解決方案還是自研AI芯片和Dojo超算,都算不上是“大新聞”,最令人吃驚的,實(shí)際上是一個“彩蛋”:特斯拉宣布即將推出類人機(jī)器人,也就是所謂的Tesla Bot。 對于人工智能技術(shù),馬斯克顯然還有更遠(yuǎn)大的追求。8月21日,清華大學(xué)人工智能研究院視覺智能研究中心主任鄧志東對智庫君表示,無論是FSD還是消費(fèi)級的個人機(jī)器人,核心都是AI,而自動駕駛、個人機(jī)器人這兩大應(yīng)用場景,在未來經(jīng)濟(jì)社會發(fā)展中都具有顛覆性,也蘊(yùn)含了巨大的產(chǎn)業(yè)發(fā)展空間。 不過,整體而言,當(dāng)前人工智能在產(chǎn)業(yè)界的應(yīng)用還不盡如人意。即便是特斯拉,它的自動駕駛技術(shù)盡管在業(yè)內(nèi)已經(jīng)比較領(lǐng)先,但仍然遠(yuǎn)未成熟,目前僅處于還需要人為監(jiān)管的輔助駕駛階段,近期,其輔助駕駛功能上的一些缺陷更是引發(fā)了廣泛關(guān)注。 人工智能落地的野心與現(xiàn)實(shí),顯然還存在著不小的鴻溝。 特斯拉AI技術(shù)體系的靈魂“特斯拉的AI能力,其技術(shù)迭代之快,至少是目前全世界其他新、老車企所不具備的。這為自動駕駛與個人機(jī)器人的應(yīng)用落地與產(chǎn)業(yè)發(fā)展,提供了更大的預(yù)期。”鄧志東對智庫君表示。 在AI日活動上,特斯拉向外界展示了其在AI領(lǐng)域的各項(xiàng)成果,包括純視覺方案FSD的進(jìn)展、神經(jīng)網(wǎng)絡(luò)自動駕駛訓(xùn)練、D1芯片、Dojo超級計算機(jī)等等。其中一項(xiàng)重頭戲便是純視覺方案FSD的進(jìn)展。 與業(yè)內(nèi)絕大多數(shù)自動駕駛解決方案供應(yīng)商的技術(shù)路線不同,特斯拉一直堅持純視覺方案,通過攝像頭進(jìn)行環(huán)境感知,不用激光雷達(dá),也不用高精地圖。相對來說,這種方案的硬件成本相對較低,但對數(shù)據(jù)和算法的要求更高。 發(fā)布會上介紹的方案顯示,特斯拉通過8個環(huán)繞全車身的攝像頭獲取道路周邊信息,并通過多任務(wù)的神經(jīng)網(wǎng)絡(luò)架來拼接不同的圖像。為了讓拼接出的信息更逼真、更有參考價值,特斯拉開發(fā)了一套技術(shù),可以通過攝像頭的信息繪制3D鳥瞰圖,并形成4D的空間和時間標(biāo)簽的“路網(wǎng)”以呈現(xiàn)道路等信息,幫助車輛更精準(zhǔn)地把握駕駛環(huán)境。 上述過程,在自動駕駛中的專業(yè)術(shù)語是感知,而感知僅僅是自動駕駛核心技術(shù)中的一項(xiàng)。有了海量數(shù)據(jù)基礎(chǔ)之后,還需要建立一個強(qiáng)大的神經(jīng)網(wǎng)絡(luò),對這些數(shù)據(jù)進(jìn)行整合和重新分析。 鄧志東指出,對于神經(jīng)網(wǎng)絡(luò)大模型,通常需要大數(shù)據(jù)、大算力的“暴力”支撐,在自動駕駛賽道,特斯拉基于眾包的互聯(lián)網(wǎng)思維,以首創(chuàng)的影子模式獲得了最大規(guī)模的真實(shí)道路交通大數(shù)據(jù),而這次發(fā)布會也展示了特斯拉在自動駕駛仿真或數(shù)字孿生系統(tǒng)上的成果。 據(jù)介紹,特斯拉建立了一個1000人規(guī)模的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),結(jié)合人工的細(xì)膩與機(jī)器的高效,對物體信息進(jìn)行標(biāo)注。同時特斯拉還開發(fā)了仿真場景技術(shù),模擬現(xiàn)實(shí)中不常見的“邊緣場景”,來提升神經(jīng)網(wǎng)絡(luò)的培訓(xùn)效率。 “這方面的工作不僅可以獲得更大規(guī)模的合成數(shù)據(jù),而且對基于深度強(qiáng)化學(xué)習(xí)的決策規(guī)劃研究,對應(yīng)用落地之前如何解決長尾問題、邊緣小概率事件等,都具有特別重要的意義。”鄧志東表示。 隨著所需處理的數(shù)據(jù)開始呈指數(shù)級增長,特斯拉也在提高訓(xùn)練神經(jīng)網(wǎng)絡(luò)的算力,因此,Dojo超級計算機(jī)誕生。實(shí)際上馬斯克此前已經(jīng)多次“劇透”過Dojo超級計算機(jī)的存在,這次AI日發(fā)布的,更引人注目的是組成Dojo超級計算機(jī)的關(guān)鍵單元——特斯拉自主研發(fā)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練芯片——D1。 早在2019年4月特斯拉就量產(chǎn)了自研的FSD芯片,這次展示的D1芯片,在架構(gòu)與性能上都有了大幅度升級。據(jù)稱,D1芯片采用分布式結(jié)構(gòu)和7納米工藝,搭載了500億個晶體管、354個訓(xùn)練節(jié)點(diǎn),僅內(nèi)部的電路就長達(dá)17.7公里,實(shí)現(xiàn)了超強(qiáng)算力和超高帶寬。 而Dojo超算,原來是由5760塊英偉達(dá)的A100顯卡構(gòu)建,而現(xiàn)在則完全改成了自研,由3000 塊D1 芯片或120個訓(xùn)練單元組成,總算力達(dá)到了9PFLOPs(9千萬億次),能夠適應(yīng)海量視頻大數(shù)據(jù),實(shí)現(xiàn)AI大模型訓(xùn)練。 馬斯克曾表示,最終會將Dojo超算提供給希望使用它來訓(xùn)練神經(jīng)網(wǎng)絡(luò)的其他公司,這意味著,特斯拉有可能將AI應(yīng)用擴(kuò)展到自動駕駛之外的其他領(lǐng)域,這次亮相的機(jī)器人便在一定程度上證實(shí)了這個可能性。 據(jù)悉,Tesla Bot高1.72米,重56.6千克,臉上的屏幕可顯示信息,擁有人類水平的雙手,并有力反饋感應(yīng),能夠?qū)崿F(xiàn)平衡和敏捷的動作——它就將利用Dojo超級計算機(jī)的訓(xùn)練機(jī)制來改進(jìn)功能。 馬斯克表示:“未來勞動力不會短缺,但體力勞動只是一種選擇。Tesla Bot可以執(zhí)行一些危險性、重復(fù)性、枯燥的任務(wù)?!边@個項(xiàng)目已經(jīng)提上日程,按照計劃,Tesla Bot或?qū)⒃诿髂晖瞥鍪讉€原型機(jī)。 鄧志東指出,目前的AI,可以對產(chǎn)業(yè)賦能的實(shí)際就是具有學(xué)習(xí)能力的數(shù)據(jù)智能,或者說大規(guī)模的神經(jīng)網(wǎng)絡(luò),從AI算法來看,特斯拉顯然抓住了多攝像頭視覺神經(jīng)網(wǎng)絡(luò)這一核心架構(gòu),力圖通過神經(jīng)網(wǎng)絡(luò)固有的學(xué)習(xí)能力,來解決自動駕駛甚至是個人機(jī)器人場景的一切問題。 “用自主學(xué)習(xí)來解決感知、預(yù)測與規(guī)控等挑戰(zhàn),可以充分發(fā)揮機(jī)器超越人類的能力,這是特斯拉AI技術(shù)體系的靈魂,也是特斯拉在理念上最領(lǐng)先的地方?!编囍緰|指出。 AI落地仍存挑戰(zhàn)此次“秀肌肉”,特斯拉的目的是為了招攬AI領(lǐng)域更多的專業(yè)人才。 盡管特斯拉是自動駕駛行業(yè)一定意義上的“領(lǐng)頭羊”,但其距離真正的無人駕駛也還有很長一段距離,即便是現(xiàn)在已經(jīng)落地的輔助駕駛功能,也并未做到盡善盡美。從這個角度看,AI技術(shù)進(jìn)一步發(fā)揮作用還有待進(jìn)一步完善。 近期,美國國家公路交通安全管理局(NHTSA)啟動了對特斯拉的調(diào)查。據(jù)悉,NHTSA調(diào)查的11起事故均與特斯拉的Autopilot(自動輔助駕駛)或其他自動駕駛功能有關(guān),其中,7起事故造成了人員傷亡,共計17人受傷和1人死亡。 具體而言,這些事故發(fā)生在2018年1月22日至2021年7月10日之間,橫跨九個不同的州。它們大多發(fā)生在晚上,事故后的場景中都有一些諸如急救車燈、照明彈、發(fā)光箭頭板和路錐等物體——從場景上看,在道路救援人員停下車輛實(shí)施救援任務(wù)的時候,特斯拉的自動輔助駕駛功能未能成功識別到這些物體和車輛,進(jìn)而發(fā)生碰撞。 上汽集團(tuán)技術(shù)中心的一位規(guī)控工程師在分析該類事故原因時指出,錐桶+靜止異性車輛是個典型的邊緣場景,單純攝像頭甚至是攝像頭+毫米波雷達(dá)的傳感器組合都很難覆蓋到這個場景?!笆紫?,錐桶形狀比較小,遠(yuǎn)距離下毫米波雷達(dá)很難掃到,靜止目標(biāo)(包含車輛)則很容易被過濾掉。而攝像頭如果沒有針對的訓(xùn)練,無法識別出障礙物也會變成睜眼瞎。即使距離駛近后識別到了車輛,也因?yàn)楦咚俳嚯x而無法避免碰撞?!?/p> 堅持純視覺方案的特斯拉,盡管已經(jīng)部署了攝像頭訓(xùn)練的方案,但顯然至今并未解決這個問題。對于特斯拉而言,這種功能上的缺陷需要盡快處理,這必然需要其進(jìn)一步壯大AI相關(guān)的團(tuán)隊(duì),這次發(fā)布會詳細(xì)地展示其技術(shù)路徑與儲備,特斯拉便是在向志同道合的行業(yè)人士拋出橄欖枝。 站在特斯拉的角度,公司的掌舵者馬斯克現(xiàn)在展示了更大的野心。這次發(fā)布會上亮相的人形機(jī)器人顯示,特斯拉不僅要做一個具備自動駕駛能力的智能汽車公司,而且要做一個覆蓋更多面的人工智能機(jī)器人公司,這對特斯拉相關(guān)技術(shù)團(tuán)隊(duì)的搭建和儲備提出了更高的要求。 從中觀的視角來看,近年來,全球人工智能行業(yè)取得快速發(fā)展,人工智能企業(yè)的數(shù)量和融資水平高速增加,圍繞人工智能產(chǎn)業(yè)的人才競爭已經(jīng)愈發(fā)激烈。 億歐智庫的一份報告顯示,在過去10年中,全球主要國家新增AI企業(yè)數(shù)量在2016年左右達(dá)到峰值,其中,中國和美國新增AI企業(yè)數(shù)量在2017年后絕對值仍然大幅度領(lǐng)先于其他國家,是全球AI企業(yè)領(lǐng)先地區(qū);從引入資金的角度來看,全球AI企業(yè)融資數(shù)量持續(xù)增長,在2016年以后呈現(xiàn)出幾何級增長趨勢,至2018年全球AI企業(yè)共計融資784.8億美元,其中美國居首。 而AI人才長期以來是嚴(yán)重的供不應(yīng)求狀態(tài)。多個研究機(jī)構(gòu)曾發(fā)出報告,全球各地AI工作崗位都存在巨大的缺口。據(jù)美國AI機(jī)器處理自動化技術(shù)研發(fā)商UIPath推出的《AI Jobs》報告,美國在2018年有7465個相關(guān)職位空缺;加拿大Element AI的首席執(zhí)行官JF Gagne發(fā)布的2019全球AI人才報告也顯示,全球AI人才庫正在增長,但需求仍然超過供給,最新的2020全球AI人才報告則顯示,盡管去年相關(guān)需求有一定下降,但對于“新角色”的需求卻一直穩(wěn)定。 JF Gagne發(fā)布的最新報告指出,人才是AI發(fā)展的掣肘,而現(xiàn)階段的AI行業(yè)需要的還不僅僅是掌握軟件算法的人才。“AI的全部潛力是否被過度炒作還有待討論,但我們可以說, AI真正獲得成功不僅僅需要高級專家以及正確的數(shù)據(jù)算法。AI行業(yè)最初專注于非常高級的專家,因?yàn)橹挥兴麄儾拍芄芾硇录夹g(shù),并將其應(yīng)用于新領(lǐng)域。但現(xiàn)在人們認(rèn)識到,這項(xiàng)新技術(shù)需要的不僅僅是工程師和能夠構(gòu)建良好模型以有效部署它的人員?!?nbsp; 該報告進(jìn)一步解釋,AI是新一代軟件,它是用數(shù)據(jù)而不是邏輯規(guī)則編碼的,相比之下,傳統(tǒng)軟件是靜態(tài)的,AI則需要一個新的基礎(chǔ)設(shè)施生態(tài)系統(tǒng),不僅要構(gòu)建,還要在部署后進(jìn)行治理,因此,為了讓AI大規(guī)模發(fā)揮作用,工程、基礎(chǔ)設(shè)施建設(shè)、新業(yè)務(wù)模式開發(fā)和目標(biāo)監(jiān)控等領(lǐng)域都需要大量的新人才。
|
|