小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

是什么讓深度學習再次崛起并超越人類?

 昵稱71360118 2020-09-01

按:作者潘爭,格靈深瞳計算機視覺工程師,清華大學自動化系博士,師從智能技術與系統(tǒng)國家重點實驗室副主任張長水。

(via:t3leads.com)

深度學習(Deep Learning)這個詞最近借著AlphaGO與李世石的人機大戰(zhàn)又火了一把。深度學習其實是機器學習(Machine Learning)的一個分支學科,而機器學習是一門研究數(shù)據(jù)之間關聯(lián)關系的學科,比如它可以用來挖掘收入和年齡,性別,職業(yè),學歷等因素的數(shù)學關系。

但是傳統(tǒng)的機器學習方法一般只能挖掘簡單的線性關系。我們知道大千世界不是線性關系所能描述的,比如收入與年齡,性別,職業(yè),學歷的關系,這么一個簡單的問題就不是一個線性關系所能表達清楚的。深度學習的出現(xiàn)改變了這種現(xiàn)狀,深度學習使用復雜的多非線性模型表示數(shù)據(jù)之間的關系,然后使用大量的數(shù)據(jù)最終確定數(shù)據(jù)之間的關系究竟是什么。

深度學習的靈感來源于大腦神經(jīng)網(wǎng)絡,可以說我們的大腦就是一個極致復雜的深度學習模型。大腦里的神經(jīng)網(wǎng)絡是由數(shù)以千億計的神經(jīng)元連接而成,深度學習也使用同樣的結構,每個人工神經(jīng)元對輸入進行簡單的線性或非線性運算后將結果傳遞給后續(xù)的神經(jīng)元,在經(jīng)過這樣十幾層乃至上百層的傳遞后得到最終的預測結果。

深度學習這套方法并不是近幾年提出的,早在80年代末Geoffrey Hinton和Yann LeCun等學者就使用深度學習的方法解決了手寫體數(shù)字的識別問題。遺憾的是,進入90年代后深度學習的性能沒有本質上的提升,甚至劣于很多簡單的線性模型,深度學習的研究沉寂下來。

直到2006年,Hinton教授在Science上發(fā)表了深度學習的里程碑一樣的論文,重新審視深度學習方法,將深度學習的性能提升到了一個新的臺階。在此之后,深度學習在語音識別,計算機視覺,機器人,自然語言處理等領域均超過了傳統(tǒng)的機器學習方法,甚至在人臉驗證比賽LFW和自然圖像分類比賽ImageNet上超過了人類的識別能力。這次,AlphaGO擊敗李世石又是一個深度學習超越人類的實例。

是什么讓深度學習再次崛起并超越人類呢? 

當然首先要歸功于Hinton等學者幾十年如一日的不懈研究。另外,有兩個客觀因素異常重要:

  • 第一是大數(shù)據(jù)。

互聯(lián)網(wǎng)將幾十億人連接在一起,同時也讓海量數(shù)據(jù)連接在了一起。深度學習必須要有海量數(shù)據(jù)才能得到表現(xiàn)好的模型,深度學習和大數(shù)據(jù)的關系就像火箭和燃料一樣,火箭雖然厲害,但是沒有大數(shù)據(jù)這個燃料也只是一堆廢鐵。因為大數(shù)據(jù)的必不可少,我們也看到深度學習做的最好的地方是我們熟知的那些擁有大量數(shù)據(jù)的IT巨頭,Google、Facebook、Microsoft、百度等??梢哉f,在深度學習時代,擁有數(shù)據(jù)就占領了人工智能的制高點。

  • 第二是高性能計算。

摩爾定律揭示了計算能力增長速度的規(guī)律,過去這些年GPU,超級計算機和云計算等計算平臺迅猛發(fā)展,讓深度學習的實現(xiàn)成為可能,舉個例子,2011年GoogleBrain用了1000臺機器、16000個CPU處理的深度學習模型大概有10億個神經(jīng)元,而現(xiàn)在我們已經(jīng)可以在幾個GPU上完成同樣的計算了。事實上,深度學習已經(jīng)進入我們的口袋了,我們的智能手機上的GPU已經(jīng)可以運行一些復雜度一般的深度學習方法了。我想過不了多久,我們每一個人都可以在手機上和AlphaGO對弈了,再過些年,我們的手機就就可以運行像人腦一樣復雜的神經(jīng)網(wǎng)絡了。

在深度學習領域有很多非常優(yōu)秀的華人科學家和中國企業(yè)??茖W家方面,我們熟知的有百度首席科學家吳恩達,IDL的發(fā)起人余凱,Caffe的作者賈揚青,第一個把人臉驗證LFW刷到99%以上的湯曉鷗、王曉剛教授,去年奪得ImageNet多項桂冠的孫劍和何凱明等等。企業(yè)方面,我們所熟知的BAT、360、搜狗、滴滴等均在深度學習方面有布局,同時國內也涌現(xiàn)出一批依賴深度學習的新企業(yè),比如格靈深瞳(安防、自動駕駛)、曠世科技(人臉識別)、商湯科技(人臉識別)、地平線機器人(ADAS)等。

深度學習不只是和人下下棋這么簡單。既然它是對人腦的一種模擬,它可以完成很多人腦的功能。

首先是視覺的功能。我們的相機可以像眼睛一樣看到這個世界,卻不能像大腦一樣看懂這個世界,深度學習恰恰補上了這個短板。有了深度學習,Google Photo、百度識圖、淘寶拍立淘才可以準確地識別照片中的物體類別,并對你的照片進行自動歸類或搜索。有了深度學習,我們才可以很酷炫地在支付寶里刷臉付款。有了深度學習,格靈深瞳的行為特征分析系統(tǒng)可以檢測場景內所有人員、車輛的行蹤,對可疑和危險事件及時報警。有了深度學習,自動駕駛汽車識別周圍路況時才足夠準確。有了深度學習,F(xiàn)aceU這樣的app才知道臉在哪里,五官又在哪里。

除了視覺功能,深度學習在語音識別方面應用也非常廣泛。百度的Deep Speech 2在一些測試中也已經(jīng)超過人類的聽力。此外,Google、Apple、Microsoft以及國內的科大訊飛等也都推出了自己的語音識別產(chǎn)品。在深度學習的幫助下,計算機擁有了越來越強大的語音識別能力,這將逐漸改變目前目前以鍵盤為主的人機交互模式。

深度學習也深刻改變著機器人領域。剛才說的基于深度學習的視覺和語音識別的能力可以幫助機器人更好地感知世界。除此之外,深度學習還和增強學習(Reinforcement Learning)相結合。

所謂增強學習指機器人通過與環(huán)境交互中得到的獎賞和懲罰自主學習(Self Learning)更優(yōu)策略。

舉個簡單的例子,AlphaGO就是一個增強學習的產(chǎn)物,它通過跟其他棋手下棋或者和自己對弈的輸贏情況自主學習更好的下棋策略。而深度學習的引入,使得增強學習方法可以找到更加復雜的策略。從AlphaGO完勝李世石可以看出,深度學習+增強學習已經(jīng)有能力讓機器人在相當復雜的環(huán)境下自主學習到高度優(yōu)化的決策策略。

以上的這些應用只是我們平時看得見的,還有很多深度學習的應用則在我們的視線之外影響世界?;ヂ?lián)網(wǎng)搜索、廣告推薦、金融量化交易、機器翻譯、醫(yī)療大數(shù)據(jù)分析、智能法律咨詢……可以說凡是需要從大量數(shù)據(jù)中預測未知信息的領域都是深度學習可以一展拳腳的地方。未來,以深度學習為代表的人工智能技術也許會像蒸汽機、電動機、計算機、互聯(lián)網(wǎng)一樣推動新一輪科技革命,讓生產(chǎn)力再上一個臺階。

當然,作為一個從業(yè)者,我同時害怕深度學習遭到捧殺,尤其是AlphaGO讓大眾熟知了這樣一項技術后。深度學習才剛剛起步,就像嬰兒剛剛學會走路,我們固然可以暢想他以后成為偉人,但畢竟很多技術還不成熟,相當一部分應用還難以讓人滿意,甚至在未來很長時間內都難以做到。人工智能的發(fā)展需要的不是大家一股腦的熱情,而是持久的投入和努力。

    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多