自動駕駛域控制器,要具備多傳感器融合、導航定位、路徑規(guī)劃、計算決策、V2X無線通訊、運動控制的能力。通常需要外接多個攝像頭、毫米波雷達、激光雷達、V2X模塊以及IMU等設備,完成包含圖像識別、數(shù)據(jù)處理等功能。 隨著自動駕駛商業(yè)化趨勢愈演愈烈,其所涉及的環(huán)境感知、控制決策、運動控制系統(tǒng),以及與車身其他域控制系統(tǒng)的交互、車聯(lián)網(wǎng)V2X的通訊信息處理,都需要一個強大的域控制器計算平臺支持,而域控制器的處理能力取決于所選型的核心AI芯片的計算能力。 目前能夠提供自動駕駛AI芯片的公司不多,業(yè)內(nèi)僅有NVIDIA、華為、瑞薩、NXP、TI、Mobileye、賽靈思、地平線等方案,且都未實現(xiàn)量產(chǎn)。 不同的自動駕駛公司,會因為不同的客戶以及需求,選擇不同的方案。但中間也會有一些共性。 當前階段,AI 芯片的主流仍然是GPU CPU,但隨著機器視覺、語音控制、深度學習的算法在 FPGA以及 ASIC芯片上的不斷優(yōu)化,此兩者也將逐步占有更多的市場份額,從而形成與GPU長期共存的局面,并逐漸實現(xiàn)反超。但從長遠看,人工智能類腦神經(jīng)芯片才是發(fā)展的終極方向。 AI 芯片是人工智能時代的技術核心之一,決定了自動駕駛計算平臺的軟硬件基礎架構和發(fā)展生態(tài)。 盡管 FPGA 倍受看好,部分AI芯片供應商紛紛采用FPGA來作為架構基礎,甚至百度大腦也是基于 FPGA 平臺研發(fā),但其畢竟不是專門為了適用深度學習算法而研發(fā),實際應用中也存在諸多局限:第一,基本單元的計算能力有限。為了實現(xiàn)可重構特性,F(xiàn)PGA 內(nèi)部有大量極細粒度的基本單元,但是每個單元的計算能力(主要依靠 LUT 查找表)都遠遠低于 CPU 和 GPU 中的 ALU 模塊;第二,計算資源占比相對較低。為實現(xiàn)可重構特性,F(xiàn)PGA 內(nèi)部大量資源被用于可配置的片上路由與連線;第三,速度和功耗相對專用定制芯片(ASIC)仍然存在不小差距;第四,F(xiàn)PGA 價格較為昂貴,在規(guī)模放量的情況下單塊 FPGA 的成本要遠高于ASIC芯片。 GPU 目前深度學習、視覺融合等人工智能計算需求,主要采用 CPU GPU、FPGA 等已有的適合并行計算的芯片來實現(xiàn)。在自動駕駛應用沒有大規(guī)模興起之前,使用這類已有的通用芯片可以避免專門研發(fā)定制芯片(ASIC)的高投入和高風險。但是,由于這類通用芯片設計初衷并非專門針對深度學習,因而天然存在性能、功耗等方面的局限性。 GPU 作為圖像處理器,設計初衷是為了應對圖像處理中的大規(guī)模并行計算。因此,在應用于深度學習算法時,有三個方面的局限性: 第一,應用過程中無法充分發(fā)揮并行計算優(yōu)勢。深度學習包含訓練和推斷兩個計算環(huán)節(jié),GPU 在深度學習算法訓練上非常高效,但對于單一輸入進行推斷的場合,并行度的優(yōu)勢不能完全發(fā)揮;第二,無法靈活配置硬件結構。GPU 采用 SIMT 計算模式,硬件結構相對固定。目前深度學習算法還未完全穩(wěn)定,若深度學習算法發(fā)生大的變化,GPU 無法像 FPGA 一樣可以靈活的配置硬件結構;第三,運行深度學習算法能效低于 FPGA。 因此,隨著人工智能算法和應用技術的日益發(fā)展,以及人工智能專用芯片ASIC產(chǎn)業(yè)環(huán)境的逐漸成熟,全定制化人工智能ASIC也逐步體現(xiàn)出自身的優(yōu)勢,從事此類芯片研發(fā)與應用的國內(nèi)外比較有代表性的公司有華為、地平線、深鑒科技、寒武紀、中星微、英偉達、谷歌、高通、英特爾等。 行業(yè)論證分析,ASIC芯片非常適合自動駕駛的應用場景。 首先,ASIC的性能提升非常明顯。例如英偉達首款專門為深度學習從零開始設計的芯片 Tesla P100 數(shù)據(jù)處理速度是其 2014 年推出GPU 系列的 12 倍。谷歌為機器學習定制的芯片 TPU 將硬件性能提升至相當于當前芯片按摩爾定律發(fā)展 7 年后的水平。正如 CPU 改變了當年龐大的計算機一樣,人工智能 ASIC 芯片也將大幅改變?nèi)缃?AI 硬件設備的面貌。如大名鼎鼎的 AlphaGo 使用了約 170 個圖形處理器(GPU)和 1200 個中央處理器(CPU),這些設備需要占用一個機房,還要配備大功率的空調(diào),以及多名專家進行系統(tǒng)維護。而如果全部使用專用芯片,極大可能只需要一個普通收納盒大小的空間,,且功耗也會大幅降低。 第二,下游需求促進自動駕駛芯片專用化。從服務器,計算機到無人駕駛汽車、無人機再到智能家居的各類家電,至少數(shù)十倍于智能手機體量的設備需要引入感知交互能力和自動駕駛計算能力。而出于對實時性的要求以及訓練數(shù)據(jù)隱私等考慮,這些應用不可能完全依賴云端,必須要有本地的軟硬件基礎平臺支撐,這將帶來海量的自動駕駛芯片需要。 在ASIC芯片需求還未形成規(guī)模、深度學習算法暫未穩(wěn)定,AI 芯片本身需要不斷迭代改進的情況下,利用具備可重構特性的 FPGA 芯片來實現(xiàn)自動駕駛計算是成為選擇之一。但由于FPGA的技術門檻兒較高,處于創(chuàng)業(yè)類自動駕駛公司而言在短期內(nèi)掌握足夠熟練的FPGA編程技術并實現(xiàn)硬件可靠性設計的難度太大,因此使用通用型CPU GPU來做自動駕駛計算平臺或域控制器的開發(fā)成為當前的主流,英偉達最近幾年的火熱足以說明一切,并且CPU GPU組合,基于Linux內(nèi)核和ROS系統(tǒng)的架構,已經(jīng)有較為成熟的生態(tài),這樣的選擇目前還是最靠譜的,也是最容易落地的。 |
|