乘客看到了停車標(biāo)志,突然感到一陣恐慌,因?yàn)樗钠嚪炊_(kāi)始加速。當(dāng)他看到前面的鐵軌上一列火車向他們疾馳而來(lái)時(shí),他張開(kāi)嘴對(duì)前面的司機(jī)大聲喊叫,但他突然意識(shí)到汽車前坐并沒(méi)有司機(jī)。列車以每小時(shí)125英里的速度撞上來(lái),壓碎了這輛自動(dòng)駕駛汽車,乘客當(dāng)場(chǎng)死亡。 這個(gè)場(chǎng)景是虛構(gòu)的,但是凸顯了當(dāng)前人工智能框架中一個(gè)非常真實(shí)的缺陷。在過(guò)去的幾年里,已經(jīng)有越來(lái)越多的例子表明,機(jī)器可以被誤導(dǎo),看見(jiàn)或聽(tīng)見(jiàn)根本不存在的東西。如果出現(xiàn)“噪音”會(huì)干擾到人工智能的識(shí)別系統(tǒng),就可能產(chǎn)生誤覺(jué)。在最壞的情況下,他們可能會(huì)因“幻覺(jué)”導(dǎo)致上面一樣危險(xiǎn)的場(chǎng)景,盡管停車標(biāo)志在人眼中清晰可見(jiàn),但機(jī)器卻未能識(shí)別出來(lái)。
人工智能領(lǐng)域工作者將這些小故障描述為“對(duì)抗性的例子”,或者有時(shí)更簡(jiǎn)單地說(shuō)是“怪異事件”。 美國(guó)麻省理工學(xué)院(Massachusetts Institute of Technology)的計(jì)算機(jī)科學(xué)家阿塔利(Anish Athalye)表示:“我們可以把這些東西看作是人工智能網(wǎng)絡(luò)會(huì)以某種方式處理的輸入信息,但機(jī)器在看到這些輸入信息后會(huì)做出一些意想不到的反應(yīng)。” 看物體到目前為止,人們主要關(guān)注的是視覺(jué)識(shí)別系統(tǒng)。阿塔利自己已經(jīng)證明,將一張貓的圖像稍加改動(dòng),人眼看來(lái)仍是一只標(biāo)準(zhǔn)的貓,卻被所謂的神經(jīng)網(wǎng)絡(luò)誤解為是鱷梨醬。神經(jīng)網(wǎng)絡(luò)是一種機(jī)器學(xué)習(xí)算法,極大地推動(dòng)了現(xiàn)代人工智能技術(shù)的發(fā)展。這類神經(jīng)網(wǎng)絡(luò)視覺(jué)識(shí)別系統(tǒng)已經(jīng)被用來(lái)增強(qiáng)你的智能手機(jī)的能力,讓手機(jī)在不被告知是誰(shuí)的情況下對(duì)你的朋友照片進(jìn)行身份標(biāo)記,或者識(shí)別你手機(jī)照片中的其他物體。 最近,阿塔利和他的同事們把注意力轉(zhuǎn)向了實(shí)際物體。發(fā)現(xiàn)只要稍微調(diào)整一下它們的紋理和顏色,他的團(tuán)隊(duì)就可以騙過(guò)人工智能,把這些物體認(rèn)作別的東西。在一個(gè)案例中,棒球被誤認(rèn)為是一杯濃縮咖啡,而在另一個(gè)案例中,3D打印的海龜被誤認(rèn)為是步槍。還有其他例子,他們制造了約200個(gè)3D打印物體,這些物體以類似的方式欺騙了電腦。今天當(dāng)我們開(kāi)始在家里使用機(jī)器人、在空中運(yùn)用自動(dòng)駕駛無(wú)人機(jī)、在街道上行駛自動(dòng)駕駛汽車時(shí),機(jī)器人的這種誤覺(jué)開(kāi)始拋出一些令人擔(dān)憂的可能性。 阿塔利說(shuō), “起初,這只是一種好奇,然而,隨著這些智能系統(tǒng)越來(lái)越多地部署在現(xiàn)實(shí)世界中,人們正將其視為一個(gè)潛在的安全問(wèn)題。” 以目前正在進(jìn)行實(shí)地試驗(yàn)的無(wú)人駕駛汽車為例:這些汽車通常依靠復(fù)雜的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)導(dǎo)航,并告訴它們?cè)撟鍪裁础?/span> 但在去年,研究人員證明,僅僅只在路標(biāo)上粘一兩張小貼紙,神經(jīng)網(wǎng)絡(luò)就可能受騙,將道路上的“停車”標(biāo)志誤認(rèn)為限速標(biāo)志。 聽(tīng)聲音神經(jīng)網(wǎng)絡(luò)并不是唯一使用的機(jī)器學(xué)習(xí)框架,但其他的人工智能框架似乎也容易遭受這些怪異事件的影響。并且不限于視覺(jué)識(shí)別系統(tǒng)。 谷歌大腦(Google Brain)正在研發(fā)智能機(jī)器。谷歌大腦的研究科學(xué)家卡里尼(Nicholas Carlini)說(shuō),“在我見(jiàn)過(guò)的每一個(gè)領(lǐng)域,從圖像分類到自動(dòng)語(yǔ)音識(shí)別,再到翻譯,神經(jīng)網(wǎng)絡(luò)都可能受到攻擊,導(dǎo)致輸入信號(hào)被錯(cuò)誤分類。”卡里尼作了展示,加上一些摩擦的背景噪音后,“沒(méi)有數(shù)據(jù)集的文章是無(wú)用的”這句話的讀音,機(jī)器會(huì)誤譯為“好,谷歌要瀏覽evil.com”。而且它不僅限于語(yǔ)音講話。在另一個(gè)例子中,巴赫(Bach)的第一號(hào)無(wú)伴奏大提琴組曲(Cello Suit 1)中的一段音樂(lè)節(jié)選被記錄為“語(yǔ)言可以嵌入音樂(lè)”。 在卡里尼看來(lái),這些對(duì)抗性的例子“最終證明,哪怕在非常簡(jiǎn)單的任務(wù)上,機(jī)器學(xué)習(xí)也沒(méi)有達(dá)到人類的能力”。 內(nèi)在原理人工神經(jīng)網(wǎng)絡(luò)是大致模仿大腦(即生物神經(jīng)網(wǎng)絡(luò))處理視覺(jué)信息的功能并從中學(xué)習(xí)方法。想象一個(gè)小孩正在學(xué)習(xí)認(rèn)識(shí)貓是什么東西:當(dāng)他們見(jiàn)到這種動(dòng)物的次數(shù)越來(lái)越多時(shí),就會(huì)開(kāi)始注意到這種動(dòng)物的一些固定模式,發(fā)現(xiàn)這團(tuán)叫做貓的東西有四條腿,有柔軟的皮毛、兩只尖耳朵、杏仁狀的眼睛和一條毛茸茸的長(zhǎng)尾巴。在兒童的視覺(jué)皮層(大腦中處理視覺(jué)信息的區(qū)域)內(nèi),多層神經(jīng)元會(huì)對(duì)視覺(jué)細(xì)節(jié)做出反應(yīng),如水平和垂直的線條,使兒童能夠構(gòu)建一幅世界的神經(jīng)“圖畫(huà)”,并從中學(xué)習(xí)視覺(jué)識(shí)別。 神經(jīng)網(wǎng)絡(luò)的工作原理與此類似,獲取的數(shù)據(jù)通過(guò)多層人工神經(jīng)元網(wǎng)絡(luò)傳輸進(jìn)行信息處理,在接受到成百上千個(gè)相同物體的樣本(通常由人類標(biāo)記)的訓(xùn)練之后,神經(jīng)網(wǎng)絡(luò)開(kāi)始建立此物體的視覺(jué)識(shí)別模式,從而能夠在其后認(rèn)得出正在觀看的東西是這種物體。其中最復(fù)雜的系統(tǒng)采用“深度學(xué)習(xí)”,這意味著需要擁有更多的信息處理層。
然而,盡管計(jì)算機(jī)科學(xué)家了解人工神經(jīng)網(wǎng)絡(luò)如何工作,但他們并不一定知道在處理大數(shù)據(jù)時(shí)的具體細(xì)節(jié)。阿塔利說(shuō), “我們目前對(duì)神經(jīng)網(wǎng)絡(luò)的理解還不夠,比如說(shuō),無(wú)法準(zhǔn)確解釋為什么會(huì)存在對(duì)抗性例子,也不知道如何解決這個(gè)問(wèn)題?!?/span> 部分問(wèn)題可能與現(xiàn)有技術(shù)被設(shè)計(jì)用來(lái)解決的任務(wù)的性質(zhì)有關(guān),例如區(qū)分貓和狗的圖像。為了做到這一點(diǎn),神經(jīng)網(wǎng)絡(luò)技術(shù)將處理大量貓和狗的模樣信息,直到有足夠的數(shù)據(jù)點(diǎn)來(lái)區(qū)分兩者。 研究機(jī)器學(xué)習(xí)框架可靠性和安全性的麻省理工學(xué)院計(jì)算機(jī)科學(xué)家麥德里(Aleksander Madry)說(shuō),“我們機(jī)器學(xué)習(xí)框架的主要目標(biāo)是'就平均值而言'有良好的表現(xiàn)。當(dāng)機(jī)器識(shí)別大多數(shù)狗的圖像表現(xiàn)很好時(shí),你感到鼓舞,但總會(huì)有一些狗的圖像讓機(jī)器困惑,無(wú)法識(shí)別?!?/span> 或許一種解決方案是用更有挑戰(zhàn)性的圖像來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。這可以使人工神經(jīng)網(wǎng)絡(luò)免受異常值的影響。 麥德里說(shuō), “這無(wú)疑是朝著正確方向邁出的一步?!彪m然這種方法看起來(lái)確實(shí)使框架更加強(qiáng)大,但也可能有一些限制,因?yàn)橛性S多方法可以改變圖像或物體的外觀從而產(chǎn)生混淆。 一個(gè)真正強(qiáng)大的圖像分類器會(huì)復(fù)制'相似性'對(duì)人類的作用,因而可以認(rèn)出一個(gè)孩子涂鴉的貓和一張貓的照片以及一只現(xiàn)實(shí)生活中移動(dòng)的貓代表的是同一樣?xùn)|西。盡管深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)令人印象深刻,但在對(duì)物體進(jìn)行分類、感知周遭環(huán)境或處理突發(fā)事件方面,仍無(wú)法與人腦匹敵。 如果我們想要開(kāi)發(fā)出能夠在現(xiàn)實(shí)世界中發(fā)揮作用的真正智能機(jī)器,或許我們應(yīng)該回到人腦上來(lái),更好地理解人腦是如何解決這些問(wèn)題的。 捆綁問(wèn)題雖然神經(jīng)網(wǎng)絡(luò)是受到人類視覺(jué)皮層的啟發(fā),但越來(lái)越多的人認(rèn)識(shí)到這種相似性只是表面現(xiàn)象。一個(gè)關(guān)鍵的區(qū)別在于,除了識(shí)別物體邊緣的線條或物體本身等視覺(jué)特征外,我們的大腦還對(duì)這些特征之間的關(guān)系進(jìn)行編碼,因此,物體的邊緣就構(gòu)成了這個(gè)物體的一部分。這使我們能夠?qū)ξ覀兯吹降哪J劫x予意義。 “當(dāng)你或我看著一只貓時(shí),我們看到了構(gòu)成貓的所有特征,以及它們之間的相互關(guān)系,” 牛津大學(xué)理論神經(jīng)科學(xué)和人工智能基金會(huì)(Oxford Foundation for theory Neuroscience and Artificial Intelligence)的斯特林格(Simon Stringer)如此說(shuō)。“這種相互'捆綁的'信息是我們理解世界的能力和我們的一般智力的基礎(chǔ)?!?/span> 這個(gè)起關(guān)鍵作用的捆綁信息在當(dāng)代的人工神經(jīng)網(wǎng)絡(luò)中是缺失的。 斯特林格解釋說(shuō), “如果你還沒(méi)有解決捆綁問(wèn)題,你可能會(huì)意識(shí)到場(chǎng)景中的某個(gè)地方有一只貓,但你不知道它在哪里,也不知道場(chǎng)景中的哪些特征是這只貓的一部分。” 為了簡(jiǎn)單易行,構(gòu)建當(dāng)代人工神經(jīng)框架的工程師忽略了真實(shí)人腦神經(jīng)元的一些特性,而科技界才剛剛開(kāi)始明白這些特性非常重要。神經(jīng)元通過(guò)將動(dòng)作電位(action potentials)或“峰電位”(spikes)信號(hào)發(fā)送到身體的各個(gè)部位來(lái)進(jìn)行交流,這就造成了神經(jīng)元傳輸?shù)臅r(shí)間延遲。個(gè)體神經(jīng)元之間在傳遞信息的速度上也有差異,有些快,有些慢。許多神經(jīng)元在決定是否放電時(shí),似乎會(huì)密切關(guān)注它們接收到的脈沖的時(shí)機(jī)。 “人工神經(jīng)網(wǎng)絡(luò)有這個(gè)屬性,即所有神經(jīng)元完全相同,但大腦中的神經(jīng)元卻有不同形態(tài),這讓我意識(shí)到,人腦神經(jīng)元的差異性不是無(wú)關(guān)緊要的,”布里斯托大學(xué)(University of Bristol)的神經(jīng)系統(tǒng)科學(xué)家鮑爾斯(Jeffrey Bowers)說(shuō)。他正在調(diào)查大腦哪些方面的功能未被當(dāng)前人工神經(jīng)網(wǎng)絡(luò)所采用。 另一個(gè)不同之處在于,人工合成神經(jīng)網(wǎng)絡(luò)是通過(guò)一系列人工神經(jīng)元層向一個(gè)方向傳輸信號(hào)。但斯特林格說(shuō),“在人類大腦皮層中,自上而下的連接和自下而上的神經(jīng)元連接是一樣多?!?/span> 為了更好地理解人腦的工作原理,他的實(shí)驗(yàn)室對(duì)人腦進(jìn)行了計(jì)算機(jī)模擬。當(dāng)他們最近調(diào)整他們的模擬,將這些關(guān)于真實(shí)神經(jīng)元的時(shí)間和組織的信息整合到一起,然后用一系列的視覺(jué)圖像對(duì)計(jì)算機(jī)進(jìn)行訓(xùn)練時(shí),他們發(fā)現(xiàn)計(jì)算機(jī)的模擬處理信息的方式發(fā)生了根本性的轉(zhuǎn)變。 他們開(kāi)始看到更復(fù)雜的活動(dòng)模式的出現(xiàn),而不是所有神經(jīng)元同時(shí)放電。其中一個(gè)人工神經(jīng)元子群其作用似乎是信息守門人。這個(gè)神經(jīng)元子群只有在整個(gè)系統(tǒng)所接受的某個(gè)視覺(jué)場(chǎng)景的所有低級(jí)和高級(jí)特性信息同時(shí)到達(dá)時(shí)才會(huì)放電。 斯特林格認(rèn)為,這些“捆綁神經(jīng)元”的行為就像大腦中的結(jié)婚證,使神經(jīng)元之間的關(guān)系正式化,并提供了一種方法來(lái)驗(yàn)證兩個(gè)看似相關(guān)的信號(hào)是否真的相關(guān)。通過(guò)這種方式,大腦可以檢測(cè)出現(xiàn)在視覺(jué)場(chǎng)景中的兩條對(duì)角線和一條曲線是否真的代表了一個(gè)特征,比如貓的耳朵,或者是完全不相關(guān)的東西。 斯特林格說(shuō), “我們的假設(shè)是,視覺(jué)大腦中呈現(xiàn)的捆綁特征,以及在我們的生物強(qiáng)化神經(jīng)網(wǎng)絡(luò)中的復(fù)制,可能在增強(qiáng)生物視覺(jué)的穩(wěn)健性方面發(fā)揮重要作用,包括對(duì)物體、面孔和人類行為的識(shí)別。” 斯特林格的研究小組目前正在尋找證據(jù),證明真實(shí)的人類大腦中存在這樣的神經(jīng)元。他們還在開(kāi)發(fā)“混合”神經(jīng)網(wǎng)絡(luò),將這些新信息結(jié)合進(jìn)人工神經(jīng)網(wǎng)絡(luò),看看是否能產(chǎn)生一種更強(qiáng)大的機(jī)器學(xué)習(xí)形式。 鮑爾斯說(shuō), “目前還不清楚這是否在真的大腦中發(fā)生,但這確實(shí)很吸引人,并突出了一些有趣的可能性?!?/span> 斯特林格的團(tuán)隊(duì)將要測(cè)試的一件事是,他們受生物大腦啟發(fā)的神經(jīng)網(wǎng)絡(luò)是否能夠可靠地區(qū)分一個(gè)老人是在家中跌倒,或只是坐著不動(dòng),或者是正在放下購(gòu)買的日用品。 斯特林格說(shuō),“對(duì)于今天的機(jī)器視覺(jué)算法來(lái)說(shuō),這仍然是一個(gè)非常困難的問(wèn)題,然而對(duì)人腦則是輕而易舉之事?!彼€與位于英國(guó)威爾特郡(Wiltshire)波頓唐(Porton Down)的國(guó)防科技實(shí)驗(yàn)室(Defence Science and Technology Laboratory)合作,開(kāi)發(fā)他神經(jīng)系統(tǒng)框架的下一代增強(qiáng)版。這個(gè)增強(qiáng)版可以用于軍事,比如從安裝在自動(dòng)無(wú)人機(jī)上的智能攝像頭中發(fā)現(xiàn)敵方坦克。 斯特林格的目標(biāo)是在20年內(nèi)將老鼠等級(jí)的智能賦予一臺(tái)機(jī)器。不過(guò)他承認(rèn)創(chuàng)造人類水平的機(jī)器智能可能需要一生的時(shí)間,甚至更長(zhǎng)。 麥德里同意,受神經(jīng)科學(xué)啟示是解決當(dāng)前機(jī)器學(xué)習(xí)算法問(wèn)題的有趣方法。 他說(shuō),“越來(lái)越清楚的是,大腦的工作方式與我們現(xiàn)有的機(jī)器深度學(xué)習(xí)模式非常不同,因此,最終可能會(huì)走上一條完全不同的路才能成功。很難說(shuō)可行性有多大,以及取得成功需要多長(zhǎng)時(shí)間。” 與此同時(shí),對(duì)于越來(lái)越多人工智能驅(qū)動(dòng)的機(jī)器人、汽車和程序,我們可能需要避免對(duì)其過(guò)于信任。因?yàn)槟阌肋h(yuǎn)不知道人工智能是不是正在產(chǎn)生被誤導(dǎo)的視覺(jué)。 |
|