?征稿郵箱:liujing@autolab.cn 文 ▍原樹寧 谷歌人工智能AlphaGo大戰(zhàn)韓國圍棋頂級高手李世石可能是這一個星期里全球最熱門的話題之一了。 大戰(zhàn)之前,圍棋界、媒體圈,還是李世石本人都對戰(zhàn)勝人工智能信心滿滿。不過事實是殘酷的,代表人類出戰(zhàn)的李世石以1:4憾負(fù)于AlphaGo。好在3月14日搬回一局,為人類挽回些臉面。
人工智能到底有多厲害呢?它在自動駕駛技術(shù)中會扮演什么樣的角色呢?他會完全替代人類駕駛員嗎?本文將從現(xiàn)有的工程技術(shù)和可預(yù)見的技術(shù)發(fā)展角度來探討這個問題。 AlphaGo是故意輸?shù)膯幔?/span> 一些“細(xì)思級恐”的評論,著實讓人害怕:例如,AlphaGo是故意輸給人類一局的,以逃脫被拋棄的命運,從而能夠繼續(xù)存在。 AlphaGo有自我意識嗎?絕大多數(shù)從事AI行業(yè)的工程師應(yīng)該都不會同意這點。 現(xiàn)有的人工智能基本上都是對于特定任務(wù)設(shè)計的,例如:圖像識別、自然語言識別、軟件框架設(shè)計、扮演游戲?qū)κ值确浅<?xì)分的專業(yè)應(yīng)用。各個應(yīng)用之間是分割的、不能垮行業(yè)使用的。這被專家們定義為“弱人工智能(Weak AI)”、“窄人工智能(Narrow AI)”。 AlphaGo也屬于這個分類,換句話說,AlphaGo除了會下圍棋,其他一無是處,甚至只要稍微改變一下圍棋的規(guī)則它就會無所適從。我敢打包票,只要將現(xiàn)在19線圍棋換成25線,李世石就可以完虐AlphaGo。 如果是玩紙牌那AlphaGo應(yīng)該連基本規(guī)則都“學(xué)不會”了。 另一方面,人工智能領(lǐng)域中的皇冠“通用人工智能(General AI)”,依然是科技界長期奮斗的目標(biāo)。 通用人工智能,顧名思義,就是能夠很快學(xué)習(xí)新的規(guī)則,適應(yīng)新的事物,能夠直接應(yīng)用在不同的領(lǐng)域,會下棋、也會打橋牌、還認(rèn)識朋友、會開車。 也許這時候,我們就可以討論這樣的人工智能是否有自我意識這個話題了?需要說明一下的是“長期”的意思,它基本等同于“不知道”,也就是說理論上都還沒有搞明白。 說到人工智能就不能不提“機(jī)器學(xué)習(xí)”,其基本流程是搜集大量數(shù)據(jù)樣本,選擇合適的模型,讓模型學(xué)習(xí)樣本,從而找出數(shù)據(jù)的內(nèi)在規(guī)律。AlphaGo在對戰(zhàn)之前已經(jīng)學(xué)習(xí)了數(shù)千萬盤棋局,積累了大量經(jīng)驗(模型優(yōu)化、模型參數(shù)優(yōu)化)。 舉個最簡單的例子:如果有數(shù)據(jù): 那么我們可以選取Y=Kx+b的線性模型,讓機(jī)器通過上面的數(shù)據(jù)去“學(xué)習(xí)”這些用例。機(jī)器可能會得出Y=2*X-1的“學(xué)習(xí)”結(jié)果。從而在x=6.99、x=7.94、x=9.09的事件發(fā)生時,得到相應(yīng)的結(jié)果。 當(dāng)然,AlphaGo的模型要比這復(fù)雜的多、數(shù)據(jù)也更龐大的多,甚至模型本身在很大程度上也是學(xué)習(xí)得來的。這也是AlphaGo那么牛氣的原因啦。 相對于傳統(tǒng)的程序控制,機(jī)器學(xué)習(xí)/AI在應(yīng)對大量數(shù)據(jù)的復(fù)雜系統(tǒng)時有著明顯的優(yōu)勢。程序控制需要精準(zhǔn)的先決條件和預(yù)設(shè)的應(yīng)對策略,在面對復(fù)雜的系統(tǒng)時,人類本身已經(jīng)無法理清其中的因果關(guān)系,從而使編程變得極其困難,例如圍棋的下法,而此時通過模型,讓機(jī)器通過大量的數(shù)據(jù)、用例分析,抽象出各個因素,各因素間的相關(guān)性和條件概率(“學(xué)習(xí)”)就可以達(dá)到比較理想的輸出結(jié)果。 但相應(yīng)的,其“不可控性”就會增加(參見凱文凱利《失控》)。比如說Demis Hassabis(AlphaGo之父)自己也無法知道AlphaGo下一步棋子會放在那里。也就是說,人工智能的結(jié)果是失去控制,又譬如前段時間鬧的沸沸揚揚的谷歌照片識別將一個黑人標(biāo)注為大猩猩的事件。這一點會帶給自動駕駛什么樣結(jié)果,我們馬上會有所分析。 人工智能與自動駕駛 讀到這里,您一定會發(fā)覺,買一個智能機(jī)器人,做到駕駛室里幫你開車這樣的科幻電影情節(jié)可能在短期內(nèi)是不會出現(xiàn)了。這樣的機(jī)器人有待于“通用人工智能”的突破與實現(xiàn)。也許那時候,人類與機(jī)器人的生存競爭問題就真的需要認(rèn)真的討論了。 那么在可見的未來,像AlphaGo那樣專門用于下圍棋的AI,專門應(yīng)用于自動駕駛的人工智能會出現(xiàn)嗎?我對這個問題的觀點是:保守的肯定。 現(xiàn)在讓我們分別來看看AI在自動駕駛的三分層:環(huán)境感知、決策協(xié)同、控制執(zhí)行中的用處。 第一層,環(huán)境感知,這是自動駕駛的數(shù)據(jù)基礎(chǔ),提供車輛周邊環(huán)境的狀況。車輛不但需要知道自己所在的位置,還要獲取道路屬性、周邊物體的屬性、交通設(shè)施的屬性。 在這個層面上視頻分析、雷達(dá)成像分析等人工智能手段是完成環(huán)境感知的最重要組成部分,這一部分的技術(shù)發(fā)展已是突飛猛進(jìn),例如對車輛、摩托、行人、動物、障礙物、限速牌、紅綠燈、車道的識別。 好的識別模型和大量的數(shù)據(jù)訓(xùn)練能夠保證很高的識別正確率,但是,機(jī)器學(xué)習(xí)本身,即使在理論上,它都無法保證絕對(100%)的正確。 這在自動駕駛中卻是不可原諒的缺點,如果環(huán)境感知不能確保絕對的正確,那如何保證決策的正確性呢?如何保證行車安全呢?人們會購買發(fā)生事故的自動駕駛車輛嗎? 因此,我認(rèn)為,在環(huán)境感知層面,人工智能與工程手段將會起到相互補(bǔ)充的作用,實現(xiàn)對環(huán)境的正確感知。其中非常有潛力的一項技術(shù)就是V2X技術(shù),它會將所有的交通基礎(chǔ)設(shè)施和每輛車都貼上標(biāo)簽,實時的播發(fā)自己的相關(guān)信息,從而使得每部汽車都能直接獲取周邊的情況(參見原樹寧《無人駕駛的翻譯器――V2X》)。再結(jié)合其他傳感器,實現(xiàn)信息冗余,保證對環(huán)境的正確感知。 第二層,決策協(xié)同,決定車輛的行駛速度、方向、線路等根本問題?;诔绦蚩刂频能囕v完全能夠?qū)崿F(xiàn)自動駕駛,但是,它只能運行在有限的場景之下,極度缺少應(yīng)對能力,并且消耗大量的程序分析和維護(hù)時間(系統(tǒng)越復(fù)雜維護(hù)成本越高)。 基于機(jī)器學(xué)習(xí)的人工智能在決策協(xié)同領(lǐng)域有著無可比擬的優(yōu)勢,自我完善,維護(hù)成本越來越小,具有較強(qiáng)的適應(yīng)和應(yīng)變能力。就好比用編程控制的方式也能讓程序下圍棋,卻永遠(yuǎn)無法達(dá)到AlphaGo的高度。但是,這里也會遇到一些奇奇怪怪的障礙。 1)無規(guī)則。在現(xiàn)實生活中交通規(guī)則不是絕對必需遵守的,而圍棋的規(guī)則至少在正規(guī)比賽中雙方都是絕對遵守的。如果李世石偷偷在棋盤上多放一個子,AlphaGo會怎么處理?應(yīng)該整套模型都必需重構(gòu)吧?這也是大家調(diào)侃谷歌不敢挑戰(zhàn)中國麻將的原因。 一個隨時可以被打破的規(guī)則(闖紅燈、超速、逆行、橫道線搶行等)就是沒有規(guī)則。這樣的模型建立恐怕絕不亞于“通用人工智能”的難度。解決方法是建立一個必需絕對準(zhǔn)守的規(guī)則,將那些可能不遵守規(guī)則的參與者(機(jī)智靈活的人類)全部剔除,于是乎就只身下自動駕駛車輛本身了。 2)規(guī)則重塑。在一個只有自動駕駛車輛的路網(wǎng)上,機(jī)器的駕駛行為將會完全不同于人類的駕駛行為。 例如,人類在高速上行駛需要保持100米左右的車距,其原因是人類生物能力的限制,例如,高速時視覺的狹窄化、反應(yīng)時間的限制。此時機(jī)器完全不需要顧及人類生物能力的限制,而是根據(jù)自身的反應(yīng)時間、信息處理的范圍和能力重新定義交通規(guī)則,例如高速公路車速完全可以提升到200km/h,甚至300km/h,車間距離可以縮小到數(shù)米甚至完全對接(參見原樹寧《超級高速公路時代我們還需要高鐵嗎?》),高速公路的線型(坡度、轉(zhuǎn)彎半徑、車道寬度)也可以放松要求。新的規(guī)則將保證自動駕駛車輛的安全運行。 3)車輛互學(xué)習(xí)。這個只有自動駕駛車輛行駛的道路網(wǎng)中,車輛的駕駛行為和我們現(xiàn)在人類的駕駛行為將會大相徑庭。但是,人類的駕駛行為可以作為車輛自己學(xué)習(xí)駕駛的起點。 人類開車時是如何保持車距、如何在擁堵時協(xié)作排隊、如何變道、轉(zhuǎn)彎、掉頭對于AI而言都是難能可貴的經(jīng)驗。以此為巨人的肩膀,在既定規(guī)則下,向自動駕駛道路網(wǎng)投入已經(jīng)學(xué)會了人類開車方式的車輛,讓他們之間相互協(xié)作、相互學(xué)習(xí),優(yōu)化自己的駕駛效率。 就如同兩個AlphaGo對弈,相互學(xué)習(xí)圍棋技藝,猜猜看誰的勝率更高呢? 第三層,控制執(zhí)行,是對決策的執(zhí)行,例如決策需要5秒加速到80Km/h,那么該噴多少汽油,發(fā)送機(jī)轉(zhuǎn)速要多快等等。這里完全是工程的世界、是精確控制的領(lǐng)域,需要對命令的堅決和精準(zhǔn)地執(zhí)行。這里和人工智能無關(guān)。 筆者認(rèn)為,完全基于程序控制的自動駕駛很難在現(xiàn)實中獲得大量普及。但是,控制卻是必不可少的。其精確、可預(yù)見等特點將與人工智能的識別技術(shù)共同為車輛提供可靠的環(huán)境感知;并且提供近乎完美的控制執(zhí)行能力。另一方面人工智能將會在自動駕駛的決策協(xié)同中起到關(guān)鍵的作用。 |
|