新智元編譯 來源:The Verge 譯者:王婉婷 王嘉俊 【新智元導讀】擊敗圍棋只不過是一個開始,AlphaGo 的開發(fā)公司 DeepMind 在游戲、醫(yī)療、機器人以及手機方面都有規(guī)劃。The Verge 非常迅速的采訪到了 DeepMind 的創(chuàng)始人Demis Hassabis,他說自己也被 AlphaGo 咄咄逼人又膽大包天的下法驚呆了!在后面的采訪中,Demis Hassabis 透露了 DeepMind 的下一步。 DeepMind大敗圍棋界傳奇李世石,引發(fā)了對人工智能的潛力的關注——熱度遠超近期的任何事件。但是Google下屬的AlphaGo項目并不是它唯一的計劃——甚至不是最主要的計劃。就像Deep Mind聯(lián)合創(chuàng)始人Demis Hassabis在前幾天說的那樣,DeepMind想要“破解智能”,而關于如何達成這個目標,他有許多想法。
Hassabis自己走的并不是尋常路,不過現在回顧起來似乎是最有意義的路。他小時候是一個象棋天才,在腦力奧林匹克運動會上5次獲得Pentamind冠軍,隨后在不大的年齡就與英國電腦游戲開發(fā)工作室Bullfrog和Lionhead一起闖出了聲名,致力于開發(fā)偏重AI的游戲(比如《主題公園(ThemePark)》和《黑與白(Black& White)》),之后他建立了自己的工作室Elixir。在2000年代中期,Hassabis離開了游戲行業(yè),攻讀神經科學Phd,并在之后的2010年聯(lián)合創(chuàng)立了DeepMind。
AlphaGo旗開得勝的第二天清早,Hassabis坐在了The Verge記者的面前。此刻,即使他的心思一點也沒有留給媒體,也不會讓人覺得奇怪。然而,他進入采訪室時,言辭溫和又讓人愉快。他談論了一會兒首爾四季酒店里閃耀的裝潢,隨后當一位Google發(fā)言人告訴他一夜之間韓國媒體界涌出了超過3300篇關于他的報道時,他看上去非常驚訝?!斑@簡直難以置信,是吧?”他說道,“看著某種有點深奧的東西變得這么流行真是相當有趣?!?/p>
除了AlphaGo,我們的訪談也聊到了視頻游戲、次世代智能手機助手、DeepMind在Google中的角色、機器人、AI如何推動科研、以及其他的話題。深入——非常深度的談話。
The Verge:對于不太懂AI或是圍棋的人,你會如何談論昨天發(fā)生的事引起的文化共鳴?
Hassabis:我會有幾件事想說。圍棋一直以來都是完全信息博弈游戲(perfectinformation games)的巔峰。從可能性的角度來說,它比國際象棋復雜得多,所以在AI研究領域中它差不多算是圣杯,或者說重大挑戰(zhàn),特別是在“深藍”(破解國際象棋)之后。你知道,雖然已經投入了很多努力,但我們還沒有走到那么遠的地方。蒙特卡洛樹搜索在10年前是一個很大的創(chuàng)新,但是我覺得我們對AlphaGo做的是,引進了神經網絡這種直覺層面的東西——如果你想這么稱呼它的話——而直覺的確就是頂級圍棋棋手間的差距。直播解棋時MichaelRedmond甚至一度難以點清目數,而他是一個職業(yè)九段!我對于這一點感到相當驚訝,這也向你顯示了為圍棋寫一個評估函數(valuationfunction)是多么困難的一件事。
The Verge:你有沒有被AlphaGo的哪一步棋震驚到?
Hassabis:當然。我們都驚呆了——我想李世石也是,從他的表情上來看——當AlphaGo在左側落子深入李世石的領地時。我覺得這是相當出人意料的一步棋。
The Verge:因為非常咄咄逼人?
Hassabis:既咄咄逼人又膽大包天!并且,它是在用李世石的方式與他對弈。李世石以充滿創(chuàng)造力的戰(zhàn)斗方式而聞名,他也展示出了這一點,我們也預計到會有這樣的情況發(fā)生。棋局一開始他就在整個棋盤上四處落子,沒有真正停在哪一點經營局面。傳統(tǒng)的圍棋軟件對于這種打法都不擅長,它們在局部計算上不算糟糕,但是當需要全局觀的時候就不行了。
The Verge:舉辦這些比賽,首先一個重要的目的是評估AlphaGo的能力,它能打贏還是會落敗。你從昨天的比賽中看出了什么?
Hassabis:我想,我們知道了我們沿著這個方向走到了超過——好吧,沒有超過我們的預期,不過就像我們希望得那樣遠。我們原來告訴大家,我們覺得比賽的勝率五五開。我仍然覺得這可能是正確的說法,什么事都有可能發(fā)生,我也知道李世石再次面對AlphaGo的時候可能會采用不同的策略。所以我覺得結果會是非常有趣的。
剛才說了AI的重要性,回答了你第一個問題。另一件我想說的重要的事情是AlphaGo和深藍之間的區(qū)別。深藍是一個人工打造的程序,程序員們從國際象棋大師那里獲得信息、提煉出特定的規(guī)則和領悟,而我們?yōu)锳lphaGO注入的是學習能力,隨后它通過練習和研究學會圍棋,這種做法更像人類。
The Verge:如果AlphaGo繼續(xù)一路攻城略地,下一步會是什么——未來會不會有另一場AI參與游戲的賽事?
Hassabis:我覺得對于完全信息博弈游戲來說,圍棋已經是頂峰了。當然,還是有一些其它的頂尖圍棋棋手可以讓AlphaGo與之對弈的,但是游戲是沒有了——無限制的撲克牌游戲非常困難,多人游戲有獨特的挑戰(zhàn),因為它是一個不完全信息博弈游戲。然后,顯而易見有許多視頻游戲人類都玩得比計算機更好,比如《星際爭霸》,另一個在韓國很火爆的游戲。策略游戲需要一種不完全信息世界中的高水平策略能力——這被稱為“部分可觀測”。對于圍棋來說,顯然你可以看到一切都顯示在棋盤上,所以這讓圍棋對于計算機來說顯得稍微簡單了一點。
The Verge:戰(zhàn)勝《星際爭霸》對你個人來說是一件讓你感興趣的事情嗎?
Hassabis:可能是吧。我們只對處在我們研究項目的主要軌跡上的東西感興趣。所以DeepMind的目標不只是戰(zhàn)勝游戲,雖然這的確很有趣也很讓人興奮。你知道,我個人很喜歡游戲,我曾經寫過電腦游戲,但是這是因為它們作為測試平臺來說非常有用,在這個平臺上可以卸下我們對算法的想法、測試它們能做到什么地步;這是一種非常有效的方法。最終我們想要把這個東西用在重要的真實世界問題上。
The Verge:1990年代后期,我在英國長大,從電腦雜志上看到你的名字與一些非常雄心勃勃的游戲聯(lián)系在一起。后來當我第一次聽說DeepMind、看到你的名字在里面的時候,我心想,“簡直太配了”。你可以說說你是怎么從之前的游戲行業(yè)轉到你現在做的事情上的嗎?
Hassabis:當然。像DeepMind這樣的東西一直以來都是我的終極目標。我為此策劃了超過20年,從某些方面來說。如果你回顧一下我做的一切,從最終我開始致力于AI研究來看,我的選擇就變得非常清晰了。如果你很熟悉我在Bullfrog工作室的事情還有后來一些別的事,你就會知道,對于我所寫的一切程序、我所參與的一切活動來說,AI是核心部分。顯然PeterMolyneux(Bullfrog工作室的創(chuàng)始人之一)的游戲都是AI游戲。當我16還是17歲的時候,我在編寫《主題公園》的程序,那對我來說是一段非常重要的時間,讓我意識到了如果我們真的試圖拓展AI的能力、它能強大到怎樣的地步。我們賣出了數百萬份《主題公園》的游戲,有那么多人都沉浸于玩這個游戲,這是因為游戲里的AI能夠適應你玩游戲的方式、做出改變。我們在此基礎上繼續(xù)前進,我也試圖在我接下來的游戲生涯中繼續(xù)往這個方向開拓。后來我離開了游戲行業(yè),回到學術圈和神經科學界,因為我在2000年代中期感到我們在AI研究方面已經做到了極限——當你還需要真的做出一款游戲的時候。AI研究難以繼續(xù)深入,因為發(fā)行商們只想要游戲,是吧?
The Verge:所以那時只是因為AI最顯而易見的應用就是游戲嗎?
Hassabis:當然,我是這么覺得的,我也確實認為我們當時做的AI極為前沿、讓人幾乎難以相信。我覺得1990年代學術圈還沒有什么動靜,而這些新技術——神經網絡、深度學習、強化學習——也還沒有真正得到推廣。所以事實上那時候最好的AI在游戲行業(yè)。那不是我們現在致力于研究的這種AI,它更像是有限狀態(tài)機(finite-statemachines),但是相當復雜、也能自我適應?!逗谂c白》之類的游戲中有強化學習——我仍然覺得這是強化學習用在游戲中的最復雜的一個例子。但是,隨后在2004年、2005年左右的時候,很明顯游戲行業(yè)走的路線與90年代不同了——90年代時它非常有趣也非常有創(chuàng)造力,你可以想出任何主意、然后實現它。但它后來變得更多的是在依賴于畫質、續(xù)作、還有FIFA足球游戲等等,不再那么有趣了——我在游戲方面做了我能做的一切,是時候為了DeepMind的建立而去收集不同的信息了。那就是神經科學。我想要從大腦如何解決問題中獲得靈感,那么還有比攻讀一個神經科學博士學位更好的方法嗎?
The Verge:這可能看上去是唾手可得的成果,不過如果你們現在將AI的進展應用到游戲上,會怎么樣?
Hassabis:我覺得應該會真的很驚人。最近EA有人聯(lián)系過我…【渴望的語氣】我們應該會做的。有那么多事情可以做!【笑聲】使用這些技術是非常通用的,我很想要做這件事。但是有帶寬的限制在,并且我們現在精力集中在醫(yī)療和推薦系統(tǒng)之類的方面上。不過可能到某個時間我們就會做這件事,制作一些智能的、有適應能力的AI對手,并且我覺得游戲開發(fā)者們也會喜歡這樣的——不必再為每個游戲都開發(fā)新的AI——屆時可能他們只需要通過他們的游戲訓練出一個AI就好了。
The Verge:我剛才想象了一下你在家打視頻游戲,在NPC面前比我還要疲于奔命的樣子。
Hassabis:當然【笑聲】是的,在MMG(大型多人游戲)和類似游戲里這總是讓我很受挫。我從來沒有真的為這些游戲著迷,因為NPC都太蠢了。他們沒有記憶,不會改變,不理解上下文。我覺得如果有了這種可以學習的AI,游戲就完全上升到另一個層次了。
The Verge:這周你帶來的消息里,AI未來主要的用途是醫(yī)療、智能手機助手以及機器人。讓我們來詳細聊聊。醫(yī)療方面,舉例來說,IBM的Watson在癌癥診斷方面有所建樹——DeepMind可以帶來什么?
Hassabis:好吧,現在還只是雛形。我們幾周前宣布了一項與NHS(英國國家醫(yī)療服務體系)的合作,不過這只是剛開始著手建立一個利用機器學習力量的平臺。我覺得Watson與我們做的事情非常不同,從我的理解而言——Watson更像是一個專家系統(tǒng),所以它是另一種形式的AI。我覺得你能看到這類AI做的事情會是醫(yī)療圖像的診斷,然后可能有對于自我量化(quantifiedself)或是重要跡象的長期追蹤,幫助人們有更健康的生活狀態(tài)。我覺得這很適合用強化學習。
The Verge:在與NHS的合作中,你們推出了一款看上去沒有怎么用到AI或是機器學習的app。這背后你們是怎么想的?為什么NHS要用這個app,而不是其他廠商推出的軟件?
Hassabis:NHS的軟件在我的理解中是相當糟糕的一個東西,所以我覺得第一步就是試著讓它進入21世紀。它們并不是移動端的,完全不是我們作為今天的消費者理所當然認為能看到的那種樣子。并且我覺得對于醫(yī)生和護士來說它用起來讓人覺得很挫敗,降低了他們的效率。所以我覺得第一步是,幫助他們用上更有用的工具,比如可視化和基礎統(tǒng)計信息。我們認為,我們會實現這樣的功能,然后看清我們到底需要什么,隨后再將更純熟的機器學習技術運用其中。
The Verge:這一切有多簡單?醫(yī)療資金在英國顯然會是一個充滿爭議的話題。
Hassabis:當然,呃,好吧,我們正在免費做這件事【笑聲】這讓它變得很簡單!這與大部分軟件公司都有很大的不同。大部分時候是大型跨國公司制作這種軟件,所以他們不會真正把注意力放到用戶身上,而我們在設計它的時候更像是一種初創(chuàng)企業(yè)的方式,從用戶那里傾聽反饋、從某種程度上來說與他們一起設計一個軟件。
The Verge:那么讓我們談談智能手機助手。我看到你第一天的時候演講PPT里有一張圖來自電影《她(Her)》——這會是最終形態(tài)嗎?
Hassabis:不,我的意思是,關于智能手機助手是什么樣,《她》只是一種盛行的主流觀點。我只是覺得,我們會想要讓這些智能手機助手之類的東西真正變得智能、理解上下文、對于你要做什么有更深的理解?,F在,大部分這樣的系統(tǒng)都極為脆弱——一旦你偏離了預先編程輸入的模板,它們就完全變得毫無用處。所以這意味著讓它們變得真正可以適應、變得靈活、也更穩(wěn)健。 The Verge:為了改善這些,需要有什么突破? Hassabis:我們可以的,只不過我覺得你需要一個不同的方法。再說一次,這是預編程和學習的二分法。目前基本所有的智能手機助手都屬于特殊案例和預編程的,這意味著它們很脆弱,因為只能做預編程寫好的事。然而真實的世界非?;靵y,用戶們也會在你無法提前知曉的情況下,做著不可預知的事情。我們對 DeepMind 的信念是,這也是最根本的原則,通往人工智能的唯一道路,是從地基開始打起,而且變得通用。 The Verge:AlphaGo 從學習很多游戲模式過程中順利起飛,這對于智能手機怎么使用呢?它的輸入是如此的多變? Hassabis:是啊,所有得有上萬噸的數據,而你可以從中學習到很多東西。事實上, AlphaGo 的算法,我們打算在未來幾個月嘗試的是,擺脫監(jiān)督式學習的出發(fā)點,讓它完全自我發(fā)揮,從一無所有的狀態(tài)開始。它會需要更長的時間,因為當你采用隨機方法的時候,其中的審查和錯誤會需要更多的時間訓練,也許是幾個月。但是,我們認為有這個可能性,讓它從純粹的學習中起步。 The Verge:是因為算法現在能達到的程度,所以你認為這是可能的么? Hassabis:不是的,我們本來可以這樣做的。它不會使得程序更強大,它只是做著純粹的學習。所以會有一些非監(jiān)督的部分。我們認為這個算法能夠在非監(jiān)督的狀態(tài)下工作。我們去年做了 Atari 游戲,在像素的層面玩游戲,而不會受人類知識的禁錮,它會在屏幕中做一些隨機的動作,開始游戲。 The Verge:對于 Atari 游戲來說更加容易,是因為失敗的狀態(tài)更加明顯么? Hassabis:的確更加容易,因為分數更有規(guī)律。在圍棋中,不管最終贏得還是輸掉比賽,你也僅僅得到一個分數。這就是所謂的信用分配問題(Credit Assignment Problem):這個問題是,你在圍棋中走了幾百步,但不知道具體哪一步會為最終的勝利或失敗負責,其中的信號非常微弱。而在大多數的 Atari 游戲中,所做的大多數事情都會給予分數,所以就得到了更多的面包(獎勵)去仿效。 The Verge:你可以給個是時間表么?當這些事情開始給手機市場帶來顯著性差異的時候。 Hassabis:我認為在未來的兩到三年會開始看到它。我的意思是,它在開始的時候是非常微小的,只有很小的部分會工作的更好。也許在未來的 4 到 5 年,甚至 5 年更多,你可以看到在功能上大的變化。 The Verge:你確定了未來各種各樣的可能性,而這件事是和 Google 聯(lián)系在一起最明顯的事情。 Hassabis:是的。 The Verge:你有沒有得到任何指示,這些事情被期待如何納入到 Google 的產品路線圖或商業(yè)模式中? Hassabis:不,在如何最優(yōu)化研究進展方面,我們有很強的主導權。這是我們的使命,也是為什么我們加入了 Google,這樣我們可以給研究進行渦輪增壓。這是發(fā)生在過去幾年的事情。當然,我們實際上也致力于很多 Google 內部的產品,但是他們是非常早期的階段,所以還沒準備好公布。當然我認為智能手機助手是非常核心的,我認為 Sundar Pichai 已經對此談了很多,這是 Google 未來的核心。 The Verge:Google 有另外的舉措,例如 Google Brain,它推出了機器學習的特征,像 Google 圖片搜索和其他面向用戶的東西。 Hassabis:是的,幾乎無所不在。 The Verge:你的公司和 Google Brain 有互動嗎?你們有沒有重疊的部分? Hassabis:當然,其實我們是非?;パa的。我們每周都有交談。Google Brain 主要致力于深度學習,他們也有非常卓越的工程師 Jeff Dean,所以他們已經鋪開到公司的各個角落,這也是為什么我們發(fā)明出了令人驚喜的 Google 圖片搜索。他們正在做著現象級的工作。另外,他們的團隊在山景城,所以他們離產品團隊更近,他們的研究周期也更像 12 到 18 個月。而我們有更多算法開發(fā)的工作,我們傾向于為需要兩三年研究的事情做研究,而且不需要在開始的時候就有直接的產品焦點。 The Verge:Google 對 AlphaGo 的支持有多重要?如果沒有他們,你們是否能做到? Hassabis:這是非常重要的。AlphaGo 在比賽中實際上并沒有使用那么多硬件,但我們需要大量的硬件來訓練它,做各種不同的版本,并讓他們在云端互相比賽。這需要相當多的硬件才能高效完成,所以如果沒有這些資源,在這段時間內根本無法完成。 The Verge:讓我們來說說機器人。我平時在日本,并傾向于認為日本是機器人的精神家園。我現在在日本看到的機器人以兩種方式使用。我們有像發(fā)那科這樣的工業(yè)機器人,有一個確定的目的做著讓人驚訝的事情,也有像軟銀 Pepper 那樣的迎賓機器人,盡管使用有很大的限制,但他們在很多方面都是野心勃勃。對于這個領域現在的狀態(tài),你有什么想法? Hassabis:是的,我認為你說的發(fā)那科,他們有很漂亮、很能干的身體,但缺少了智慧。而迎賓機器人和智能手機助手更像,我見過的那些,反正都是預編程了很多針對模板的反應,但如果你做一些其他事情,例如去越野的地方滑雪,那他們會感到很困惑。 The Verge:所以我猜測,一個很明顯的問題是,機器學習會如何強化機器人的能力。 Hassabis:是的,這是完全不同的方法。你可以從頭開始建立學習新事物,并能應對突發(fā)事務的能力,我認為這就是當機器人或軟件應用程序在真實世界中和用戶交互時所需要的——他們需要擁有這種能力,并妥善使用。我認為學習曲線最終必須采用正確的做法。 The Verge:對于可學習的機器人來說,什么是你看到的最直接使用案例? Hassabis:其實,我們對此沒有太多的想法。顯然,自動駕駛汽車是一種機器人,但目前來說還是狹義的人工智能,雖然他們使用了計算機視覺里面一些可學習的人工智能——特斯拉采用了一種基于深度學習的標準、現場的計算機視覺方案。我相信日本在老年護理機器人、家庭清潔機器人上面有很多思考,我認為這對社會會非常有用。特別是在一個人口老齡化的社會里,我認為是一個非常緊迫的問題。 The Verge:為什么在這些類型的案例中,一個更基礎的學習方法,能帶來如此顯著的提高呢? Hassabis:那么,你需要思考這樣的問題:“為什么我們還沒有擁有這些東西?”為什么我們沒有一個機器人,可以跟在你后面清理房子?原因在于,每個人的房子在布局、家具等方面有很多的不同,有時候它是混亂的,有時候卻很干凈。因此,很難通過預編程的方法,找到整理你的房子的解決方案,對吧?而且你還得考慮,你的個人偏好,例如你會喜歡衣服怎樣被折疊。這真的是非常復雜的問題。我們認為,這些事情對于人類來說很簡單,但實際上我們必須處理非常復雜的事情。 The Verge:出于個人興趣問一下,你有機器人吸塵器嗎? Hassabis:額,我的確有一個,但是它不怎么管用所以…(笑) The Verge:我也有一個機器人吸塵器,它不是非常管用,但我發(fā)現自己能學習它奇怪的地方,并圍繞它工作,因為我是一個懶人,而它帶來的好處值得我這么做。所以我想知道,我們什么時候能有更先進的機器人,在“足夠好”的引爆點到來之前?我們會在有意義的達到人類水平的交互和圍繞這個奇怪的小玩意工作之前,就停止研發(fā)嗎? Hassabis:是的,我的意思是,也許吧。我想每個人都會以合理的價格購買一個機器人,它可以疊好盤子,并清洗干凈——這些啞巴吸塵器非常受歡迎,但無論如何,他們并沒有真正的智能。所以,我覺得其中的每一步,逐步的的進展,就會發(fā)明出有用的東西。 The Verge:那么,你對人類、機器人和人工智能在未來的交互,有什么遙遠的期望?顯然,人們的腦袋能到達那些非??駸岬目苹玫胤?。 Hassabis:我自己對機器人沒多少思考。我自己對人工智能的使用感到興奮的領域是科學,能夠推動它更快的發(fā)展。我想看到人工智能輔助的科學,那樣會有一個人工智能研究助手,它可以做很多乏味的工作,閱讀有趣的論文,從海量的數據中找到結構,并把它們呈現到人類專家和科學家面前,以實現更快的技術突破。我?guī)讉€月前在歐洲核子研究中心做演講,很顯然它們創(chuàng)造出比地球上任何地方都多的數據,我們都知道在它們海量的硬盤中,可能會有某個新的粒子發(fā)現,但沒有人能抽出時間做這件事情,因為這里的確有太大了的數據了。所以我覺得,如果有一天人工智能參與尋找到一個新的粒子,那么是一件非??岬氖隆?/p> |
|