小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

地平線創(chuàng)始人余凱:深度學(xué)習(xí)必將引發(fā)自動駕駛的技術(shù)變革

 cheyunwang 2020-09-11
 
未來的自動駕駛,應(yīng)該像AlphaGo一樣,具備深度學(xué)習(xí)能力。

車云按:2017年6月21日-22日,由中國安全產(chǎn)業(yè)協(xié)會、TIAA車載信息服務(wù)產(chǎn)業(yè)應(yīng)用聯(lián)盟與車云網(wǎng)共同主辦的2017年中國安全產(chǎn)業(yè)峰會暨首屆交通安全產(chǎn)業(yè)論壇在北京召開。本文系地平線機器人技術(shù)創(chuàng)始人&CEO余凱在大會上的主題演講,當(dāng)中對面向未來的自動駕駛技術(shù)展開了討論,并通過實例說明了深度學(xué)習(xí)將對未來自動駕駛技術(shù)帶來巨大的變革。

地平線機器人技術(shù)創(chuàng)始人&CEO 余凱

以下為演講實錄:

感謝能有這么好的機會跟業(yè)界的同行來匯報跟交流一下我們在汽車技術(shù)方面做的一些工作。我們公司主要是在深度結(jié)合新型人工智能的處理器去做自動駕駛的解決方案,所以我介紹一下這方面的工作。


從“端到云”地平線在構(gòu)建自動駕駛汽車大腦系統(tǒng)

地平線機器人,實際上我們不造機器人,我們造的可以說是機器人的大腦,毫無疑問,如果我們想面向未來,如果能夠影響人類生活,最大規(guī)模影響每個人從出生醫(yī)院,產(chǎn)房里面一出來到家里面,然后整個人生的每一個階段。深刻的影響你生活的機器人是什么呢?我覺得沒有比汽車更重要的了。所以如果去做面向機器人技術(shù)的話,我覺得毫無疑問是自動駕駛。

地平線現(xiàn)在總部在北京,在中關(guān)村,我們同時在南京有研發(fā)中心,最近在上海的安亭成立的我們自動駕駛的研發(fā)中心?,F(xiàn)在我們有200個工程師,其實各種員工加起來,包括實習(xí)生將近有400個人,在軟件、算法、硬件、處理器的架構(gòu)設(shè)計。

所謂面向未來的自動駕駛,一方面在車這一端,我們要部署先進(jìn)的人工智能的算法,從感知到定位到環(huán)境建模到?jīng)Q策規(guī)劃到控制。這些算法的復(fù)雜性,用今天我們大家通常用的計算平臺,比如說CPU是不能去完成的。我們可以看到,除了人工智能的算法在過去幾年突飛猛進(jìn)的發(fā)展,同時平行去發(fā)展的就看到了從Intel到Nvdia再到Google都在投入做人工智能處理器的研發(fā),在中國當(dāng)然地平線是作為最早的致力于人工智能處理器變革的一家公司。所以它一定要在車上面去部署這種算法,它需要功耗足夠的低,車不能發(fā)熱,它要足夠的安全。另一方面,這還是一個大數(shù)據(jù)的系統(tǒng),因為車不斷的在感知數(shù)據(jù),把新的數(shù)據(jù)傳送到云端,在云端進(jìn)行并行大規(guī)模的訓(xùn)練,然后就構(gòu)建新的模型再重新部署到車的本地端。所以它也是在云端的一個大數(shù)據(jù)計算,我們構(gòu)建“端到云”的這種汽車大腦系統(tǒng),從軟件到硬件。

深度學(xué)習(xí)的關(guān)鍵是讓機器自主學(xué)習(xí)

談到深度學(xué)習(xí),毫無疑問在過去五六年時間里像旋風(fēng)一樣,從互聯(lián)網(wǎng)公司影響到傳統(tǒng)汽車的行業(yè)。從比較學(xué)院的這種曲高和寡的研究,到街頭巷尾到國家領(lǐng)導(dǎo)人到每一個老百姓都在談?wù)摰腁lphaGo下圍棋,背后主要都是深度學(xué)習(xí)的進(jìn)步。

深度學(xué)習(xí)實際上是機器學(xué)習(xí)的一個分支,所謂機器學(xué)習(xí)是構(gòu)造一種算法,像人的大腦一樣,能夠不斷的從數(shù)據(jù)中、從經(jīng)驗中學(xué)習(xí)變得越來越聰明。80年代末機器學(xué)習(xí)成為人工智能的主流,傳統(tǒng)的機器學(xué)習(xí)通常是一個一個的步驟,一開始從數(shù)據(jù)的感知預(yù)處理再到特征的提取、特征的變化,最后到預(yù)測跟識別,這是典型的機器學(xué)習(xí)。

過去最后一個步驟是特征提取完了以后怎么做感知。而進(jìn)入到深度學(xué)習(xí),它是把整個系統(tǒng)作為一個框架來看,之前特征的預(yù)處理與提取實際上也非常的重要,但它對計算的要求更高,對最后的效果更加的關(guān)鍵。過去這些研究都被忽略了,深度學(xué)習(xí)的影響把中間所有的步驟都變成自主學(xué)習(xí)的一個機器,從感知的數(shù)據(jù)出發(fā),直到最后輸出的結(jié)果全部都是用大數(shù)據(jù)的訓(xùn)練。

這些放在五年前,無論是在中國還是在美國,聽起來都是天方夜譚,今年已經(jīng)成為現(xiàn)實。目前最成功的這些計算機識別,語音識別,包括以前我在百度工作的像互聯(lián)網(wǎng)的廣告、搜索,還有今天下圍棋這種決策的系統(tǒng),實際上最好的系統(tǒng)都是基于深度學(xué)習(xí)的。

在這里面我分享兩個例子,我認(rèn)為是在深度學(xué)習(xí)的應(yīng)用取得了一個非常重大的,并對實際的產(chǎn)品對業(yè)務(wù)產(chǎn)生重大影響的兩個實例。

第一個實例是當(dāng)年在百度的時候,我們做的一個項目,這個項目就是說希望用深度學(xué)習(xí)去提升搜索引擎的相關(guān)性。百度與Google其實都做了類似這樣的項目,當(dāng)然百度比Google早一年做。我們在想一方面怎么用大數(shù)據(jù)訓(xùn)練,通常用人工去標(biāo)注數(shù)據(jù),我們能夠標(biāo)大概30萬個樣本,實際上可能就已經(jīng)很難了。因為標(biāo)注的成本非常貴,時間也非常的耗時。

能不能用用戶自然的數(shù)據(jù)來訓(xùn)練,而不需要人工標(biāo)注?實際上,我們是可以去用這樣數(shù)據(jù)的。比如用戶輸入一個地址,我們關(guān)注到這個用戶點擊的地址,另外一個沒有點擊。實際上就是點擊的網(wǎng)頁比另外一個沒有點擊的對搜索更相關(guān)的關(guān)鍵詞,我們就可以利用三元組,搜索詞,還有點擊的網(wǎng)頁跟沒有點擊的網(wǎng)頁,三元組成組構(gòu)成訓(xùn)練的樣本。大家可以看到訓(xùn)練樣本實際上你沒有任何的限制,你可以搜索無窮的獲得訓(xùn)練樣本,我們可以訓(xùn)練1個億參數(shù)的深度神經(jīng)網(wǎng)絡(luò),這個是在整個搜索引擎的歷史上面對所引擎的相關(guān)性提升最大的技術(shù)。

另外一個例子,這個例子叫AlphaGo,AlphaGo實際上也有很多非常非常讓人印象深刻的新技術(shù)突破。但它這里面有一個核心的思想,比如說我們最近的AlphaGo 2.0,實際上它沒有用任何的標(biāo)注數(shù)據(jù),它也沒有用人工的標(biāo)注數(shù)據(jù)。它實際上通過虛擬的程序之間的左右互搏,然后不斷的去提升它的合力。這種情況的話,也是突破了標(biāo)注數(shù)據(jù)對訓(xùn)練強大的一個神經(jīng)網(wǎng)絡(luò)帶來的限制,它可以自主的去學(xué)習(xí)。

所以剛才講的這些事情聽起來跟自動駕駛沒有關(guān)系,但是我從這兩個事例里面獲得一些啟發(fā)。首先第一點,在第一個系統(tǒng)里面,用深度神經(jīng)網(wǎng)絡(luò)來做排序,這個里面核心的思想是說,與其讓人工來標(biāo)注數(shù)據(jù),那我們是不是也可以讓它自主的去用戶自然數(shù)據(jù)里面去學(xué)習(xí)?

第二個例子是下圍棋。下圍棋是通過自然的數(shù)據(jù),利用系統(tǒng)虛擬地去做仿真,從仿真里面去照出虛擬的數(shù)據(jù)然后再訓(xùn)練這個模型。這兩個思想放在一起,它的一個核心的共性是:我們不是在構(gòu)造一個虛擬的人工系統(tǒng),而是自主學(xué)習(xí)人工系統(tǒng),這點是我今天要講的主要話題。未來的自動駕駛的汽車,它實際上是自主學(xué)習(xí)的,而不是被訓(xùn)練的,這點非常重要。這里面一個核心的要素,就是說在訓(xùn)練、學(xué)習(xí)的時候,它是從自然的數(shù)據(jù)里面去學(xué)習(xí),而不是一個被動的去輸入標(biāo)注的數(shù)據(jù)。

從軟件到硬件再到數(shù)據(jù),整合構(gòu)建擁有深度學(xué)習(xí)能力的自動駕駛系統(tǒng)

其實剛才我已經(jīng)講了我今天報告主要的要點。地平線認(rèn)為構(gòu)建未來的自動駕駛系統(tǒng),如果單純做軟件或單純做硬件都是不行的,單純在本地端而不在云端構(gòu)建大數(shù)據(jù)的系統(tǒng)也是不夠的。所以我們要做的叫全棧式技術(shù)的開發(fā),從軟件到硬件、從本地到云端。

首先軟件層面,我們需要克服很多挑戰(zhàn),我認(rèn)為有三個大挑戰(zhàn)。第一個什么讓系統(tǒng)從黑箱變成一個白箱系統(tǒng)。第二個是說怎么樣讓這個系統(tǒng)能夠不斷的自主學(xué)習(xí)。第三個是說怎么樣讓這個軟件對硬件友好,因為一定要低功耗、高效率、低延遲,這里面軟件跟硬件的配合非常重要。

怎么去構(gòu)建一個可解釋的、人可以理解的深度神經(jīng)網(wǎng)絡(luò)呢?我們需要去回顧到整個人工智能的歷史。在80年代末的時候,神經(jīng)網(wǎng)絡(luò)被提出來熱了一陣子卻又被冷掉。在90年代基于因果推理的理論導(dǎo)出,實際上是主流,到2011年的時候衰落,因為深度學(xué)習(xí)又起來。這個歷史是循環(huán)往復(fù)的發(fā)展,但是今天看起來Bayes網(wǎng)絡(luò)所謂的科技實際上可以跟深度網(wǎng)絡(luò)結(jié)合,它同時是白箱子系統(tǒng),這個是地平線正在做的事情。

這樣的一個白箱子系統(tǒng),可以理解為是一個非常大的Bayes網(wǎng)絡(luò),實際上是用一個小的、子的深度神經(jīng)網(wǎng)絡(luò)來表示的。這樣模塊跟模塊之間的接口是清晰可定義的,但實際整個的系統(tǒng)它可以端到端的學(xué)習(xí)。同時在這樣一個框架里面,這個系統(tǒng)是一個完全的不斷自主學(xué)習(xí),白天晚上每一秒鐘不斷從路上的經(jīng)驗去學(xué)習(xí)。

另外還有一個好處,因為它接口之間是清晰定義的,所以它能夠非常容易的去整合基于規(guī)則的系統(tǒng),基于人工規(guī)則的系統(tǒng)。另外一點,就是怎么樣去構(gòu)建一個單個的深度神經(jīng)網(wǎng)絡(luò),使得它是可解釋的。

最終關(guān)乎到?jīng)Q策,如果決策實際上就要去用到所謂的增強學(xué)習(xí)的這么一個框架,在這樣一個框架,車實際上不僅僅是從每一個司機自然的行為里面去學(xué)習(xí),同時它也從仿真的系統(tǒng)里面去學(xué)習(xí)。這個其實也反映就是我剛才講的兩個觀點,從自然數(shù)據(jù)去學(xué)習(xí),通過仿真來學(xué)習(xí),跳出標(biāo)注樣本所帶來的局限。

另外就是關(guān)于硬件,硬件我們關(guān)注兩個方面,第一個方面就是系統(tǒng)硬件,包括編譯器跟運行時的軟件,然后來提升軟件的運行。同時我們需要從感知到定位到三維建模到預(yù)測到推理,實際上我們要根據(jù)軟件本身的構(gòu)架適應(yīng)性重新的去設(shè)計它處理器的架構(gòu)。這個實際上當(dāng)前在Google的TPU,包括地平線最近在做的BPU,根據(jù)軟件的硬件重構(gòu)。

我們可以看到在人工智能時代,實際上整個軟件應(yīng)用所帶動處理器的變革其實正在發(fā)生。我們可以看到在深度神經(jīng)網(wǎng)絡(luò)計算里面,我們傳統(tǒng)的ABG跟GPU表現(xiàn)了不同的能力,我們可以看到其實在一年半的時間里面從一個排名大概是排不到前幾年的半導(dǎo)體公司到今天成為世界第二大的半導(dǎo)體公司,成為一個一千億美金的公司,就是因為整個軟件應(yīng)用的驅(qū)動帶來處理器架構(gòu)的重構(gòu),所帶來一個新的機會。

這里面其實也有一些相當(dāng)?shù)臋C會,因為軟件的算法不斷演進(jìn),如何使你處理器架構(gòu)靈活。最靈活的方式其實從電路上面不斷改變電路的方式,F(xiàn)PGA實際上在自動駕駛領(lǐng)域有它相當(dāng)?shù)纳Α.?dāng)然,最終一旦軟件算法本身能夠固定下來,那專用集成電路一定是未來的方向,就是所謂的叫ASIC。Google的TPU和地平線的BPU都是在往這個方向走,可以看到在TPU它有最大的計算能力,但是每瓦的計算力實際上是比較低的。ASIC它可以做的最好,但是同時每瓦功耗計算能力能夠比現(xiàn)在的GPU提高30倍到50倍,這個是現(xiàn)在產(chǎn)業(yè)競爭的焦點。地平線在按照從感知到不斷的去增強決策能力的計算。

這個是我們跟Intel在一起合作做的在處理器方面,比如說我們利用低功耗處理器設(shè)計可以做實時,對每一個象素級的感知,在非常復(fù)雜路面上面對每一個象素,每一個行人,不僅是把它大概的框出來,然后每一個細(xì)節(jié)的邊界都能夠做得非常準(zhǔn)確的這種處理。然后我們在下一代處理器架構(gòu),其實還會從二維的感知到三維語義的感知去發(fā)展。我想最終通過硬件跟軟件的聯(lián)合設(shè)計,實際上使得傳感器能夠充分實時的計算,然后去理解在周圍它所發(fā)生的不光是靜態(tài)的信息,相對位置的信息,包括動態(tài)下一個5中行人跟車輛往哪個方向去走的信息。最終去實現(xiàn)在效率,在延遲,在準(zhǔn)確率這方面的話,一個最優(yōu)的結(jié)果,這就是整個產(chǎn)業(yè)界現(xiàn)在往前去發(fā)展的。

最后,我想談一下數(shù)據(jù),數(shù)據(jù)量的增長在未來的自動駕駛時代是一個很大的挑戰(zhàn)。從現(xiàn)在開始,實際上每一個手機它有多個的傳感器,數(shù)目越來越多,每一個汽車未來傳感器的數(shù)目也會越來越多。所以傳感器的增長它一定是高于人口的增長。這樣的話,數(shù)據(jù)的增長跟傳感器的增長是線性的,計算的增長跟數(shù)據(jù)的增長是非線性的,因為越來越復(fù)雜的算法會被發(fā)明,會被提出來。所以這就給計算帶來了巨大的挑戰(zhàn)。

給大家舉一個實際的例子,目前在學(xué)術(shù)界做計算機視覺,最大的數(shù)據(jù)集差不多是100萬的圖像的樣本,但是一個自動駕駛汽車一天收集的樣本就是600萬的高清自動圖像。1000臺這樣的車,在一天所收集的數(shù)據(jù),它相當(dāng)于整個百度的搜索引擎所檢索的整個互聯(lián)網(wǎng)圖片的數(shù)目。所以一天1000輛自動駕駛的汽車,它所搜集的數(shù)據(jù)就是這么大的一個量。那么我們怎么去應(yīng)對這樣的一個計算?其實從這個計算另外還有一方面的挑戰(zhàn)。

你在真實道路里面搜集的數(shù)據(jù),比如說突破千萬或者是億的其實也很難了。但是還有很多的不能被充分暴露出來,所以通過這種仿真讓各種情況充分暴露出來,使得上百億虛擬的公里數(shù)在你的數(shù)據(jù)中心不斷的去測試,這個也是自動駕駛的一個必經(jīng)之路。

最后,總結(jié)一下,第一個觀點,深度學(xué)習(xí)在未來一定會導(dǎo)致自動駕駛的革命,就像我們看到很多領(lǐng)域,無論是說計算機視覺,語音識別,還是下圍棋,還是很多的人工智能機器人的應(yīng)用,都被深度學(xué)習(xí)革命。第二個觀點,未來的話自動駕駛的汽車一定是活生生的在不斷自主學(xué)習(xí)的汽車,而不是說在線下你去訓(xùn)練它,訓(xùn)練完了以后再放到路上面不再自我更新。第三個觀點,就是深度學(xué)習(xí)有很多的好處,但是我們一定要應(yīng)對它的挑戰(zhàn),就是它現(xiàn)在是一個相對黑箱的系統(tǒng)。第四個觀點,我認(rèn)為非常重要的就是說,我們一定要去走所謂的像蘋果所信仰的深度軟硬件去整合,使得整個系統(tǒng)的效率跟系統(tǒng)的安全性、可靠性得到最優(yōu)。只做軟件或者只做硬件是不夠的。

好的,我的分享就是這些,謝謝大家。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多