人工智能通過大量數(shù)據(jù)來進行學(xué)習(xí),數(shù)據(jù)越多,就越強大。例如IBM公司在1997年開發(fā)的國際象棋程序“深藍(lán)”,它曾在這一年的系列比賽中打敗了當(dāng)時的世界冠軍、俄羅斯的加里·卡斯帕羅夫(Garry Kasparov)。當(dāng)時,“深藍(lán)”搭載了100萬局以上的棋譜數(shù)據(jù),每秒鐘可以計算2億步。20年前的程序雖然還沒有如今的程序這樣簡潔,但是利用過去的對局信息與強大的計算能力,“深藍(lán)”以“推土機式”的戰(zhàn)法戰(zhàn)勝了人類。十多年前,公立函館未來大學(xué)研究人工智能的學(xué)者松原仁教授曾說過:“硬件如果進步了,將棋軟件就會自動變強?!币驗椋布倪M步會使電腦的計算能力達(dá)到每秒百萬步甚至億步,軟件自然也就變強了。這個認(rèn)知基于英特爾公司的創(chuàng)始人之一戈登·摩爾(Gordon Moore)提出的“摩爾定律”。這一定律是關(guān)于電腦發(fā)展進步的經(jīng)驗法則,根據(jù)這一定律,在空間不變的情況下,集成電路的密度一年半增加一倍,所以電腦的計算速度也會以指數(shù)級急速增加。第一次聽到這個說法的時候,我只是漫不經(jīng)心地覺得“原來是這樣”,并沒有放在心上。然而最近在將棋界,電王戰(zhàn)越來越受到人們關(guān)注??吹綄⑵遘浖娘@著進步,這個說法對我來說才有了更切身的感受。舉例來說,AlphaGo在與人對弈時所使用的機器的計算能力并不是特別厲害的。然而,AlphaGo在學(xué)習(xí)階段使用的是DeepMind的母公司谷歌的巨大計算資源,并依靠這些資源快速積累了大量的數(shù)據(jù)。AlphaGo的勝利,要歸功于能夠處理龐大數(shù)據(jù)的軟件和支撐了該軟件運行的硬件技術(shù)。可以說,如果沒有稱霸世界的超大規(guī)模IT企業(yè)谷歌的支撐,就不會有AlphaGo的成功。除了大數(shù)據(jù)和硬件的發(fā)展,還有第三個要素,那就是“軟件”部分的發(fā)展,特別是深度學(xué)習(xí)(deep learning)的興起。聽說過深度學(xué)習(xí)這個詞的人恐怕不少。近來,人工智能引起了越來越多的關(guān)注,主要就是因為深度學(xué)習(xí)。在由被稱為神經(jīng)式網(wǎng)絡(luò)(neural network) 的模擬人腦學(xué)習(xí)方法構(gòu)成的人工智能算法中,它是最近最受矚目的部分。人類的神經(jīng)細(xì)胞通過電子信號互相傳遞信息,而信息傳遞的結(jié)合部,被稱為突觸。將這種由突觸結(jié)合來表達(dá)知識的原理通過數(shù)學(xué)建模,就構(gòu)成了神經(jīng)式網(wǎng)絡(luò)。這其中最令我感興趣的,是所謂的誤差反向傳播算法,因為這種算法通過刪除回答錯誤的神經(jīng)細(xì)胞來修正答案。如果每一個神經(jīng)細(xì)胞都是一個人,在一起進行傳話游戲。第一個人得到的信息是“貓就是長成這樣的生物”,就像傳話游戲一樣,每一個神經(jīng)細(xì)胞都向自己周圍的其他神經(jīng)細(xì)胞傳遞這個信息,這樣一來,終端就會知道“貓原來是這樣的啊”。那么,如果要傳一句“今天外出去新宿公干”,這句話如果只經(jīng)過兩三個人的傳遞,應(yīng)該是可以準(zhǔn)確地傳達(dá)給終端的。但是,如果通過50個人來傳遞這句話,會得到怎樣的結(jié)果呢?從第一個人開始,在若干次的傳話之后,內(nèi)容很可能在不知不覺中變成了“明天去日本橋的百貨店買東西”這類與最初的信息毫不相干的東西。為什么會變成這樣呢?往往是因為傳話的過程中出現(xiàn)了不可信的人,夾雜了烏七八糟的信息。那么,要怎么解決這個問題呢?拿將棋的學(xué)習(xí)來說,在將棋學(xué)習(xí)中,最重要的并不是記住更多的東西,而是讓自己舍棄多余的思考。同理,在玩?zhèn)髟捰螒虻臅r候,就要把這種亂傳話的糊涂蛋從游戲中抽離出去。之后再重新開始游戲,就可以正確地向終端傳遞信息了。具體來說就是這樣的:傳話過程中,如果與A相鄰的B告訴A“今天要去新宿公干”,而與A相鄰的C又對A說“明天要去日本橋的百貨店買東西”。這時候根據(jù)“傳話游戲”的結(jié)果,首先應(yīng)該認(rèn)為C是不可信的,降低對C的信任度。這樣重復(fù)幾次之后,哪個人傳的話更值得信任就很明確了。在我看來,這就是誤差反向傳播算法的本質(zhì)。我以前經(jīng)常在將棋的書里提到,減少處理無用信息的“減法”思考,是人腦思考的特征。而深度學(xué)習(xí)中竟然含有這種“減法”思考的要素,這實在是讓我覺得很有意思。
|