全網首發(fā) · 筆記導讀
一、人對于信息的感知:我們要想做出一個正確的決策,必須在每一點上都要感知正確、認知正確、分析正確,然后才能作出比較理性的決策,所以人對信息使用的這個過程,其實是非常復雜的。
二、人工智能的浪潮:第一波浪潮主要引領的是計算智能;第二波浪潮是遞歸神經網絡的誕生;第三波浪潮就是深度學習的誕生。深度學習迎來天時、地利、人和。
三、是不是所有的機器人都可以代替人類?并不是,因為:人工智能的解釋性差,理解人類的能力差,邏輯能力不強,缺乏意識。
四、目前世界上人工智能技能四個階段:第一計算智能,第二感知智能,第三認知智能,第四類人智能。
五、人工智能在2016年爆發(fā)可以說是天時地利人和。因為云計算的大規(guī)模普及,讓應用成本大幅度降低,感謝計算能力的突破以及互聯(lián)網計算能力的催生。
六、公司的招聘、人力資源環(huán)節(jié)可以利用人工智能得到更高效的提升;
七、人工智能的三大障礙: 1、積累海量的行業(yè)數據 2、擁有掌握人工智能核心技術的人才 3、管理層擁有數據意識 全網首發(fā) · 完整筆記
人工智能的概念電影傳得很神乎,但真正的原因是一些天時、地利、人和相結合,導致它的突然爆發(fā)。 人是怎樣理解信息的? 首先,跟大家分享一下,人到底是怎么樣理解信息的?比如讓我?guī)讉€月大的兒子在這里的話,他根本不知道我們在說話還是唱歌,但我5歲的女兒就能聽懂我說的一些字詞,盡管她不知道是什么意思。
所以人對于信息的理解,其實不是一個那么簡單的過程。
我屬于連續(xù)創(chuàng)業(yè)者,經歷過三次創(chuàng)業(yè),可以說每結束一次創(chuàng)業(yè),自己看待創(chuàng)業(yè)的問題,那種成熟度和知識度是完全不一樣的。 可能不同的人看同一份簡歷分析出來的結果是不一樣的,但基本上我們最常用的分析的那些點其實都是差不多的,當然也有些東西分析出來是對的,有些分析出來是不對的。
我們是怎么樣去理解信息的?分了幾個步驟去理解這個信息?這個過程是怎么發(fā)生的? 人對于信息的感知 什么叫感知? 比如我?guī)讉€月大的兒子,在座的是不是人,他其實分不清楚。那對于我5歲的女兒呢?她可能在想:這到底是一個“士”還是個“土”?是“博士”還是“博土”?這對她來講真的是一個很難的問題,因為她正在處于認字的一個初期。
對于機器來講,感知智能就是機器對于信息的認識,現(xiàn)在全世界人工智能的工作大部分都停留在這個層面。那人呢?比如看到博士之后,領導會說這是一個學歷信號,會想到博士、碩士,然后再往下想,博士是一個比碩士更高的學歷,可能我們能思考到,但可能對于很多人來講,博士已經是最高的學歷,有沒有人覺得博士后最高的?
我們要想做出一個正確的決策,必須在每一點上都要感知正確、認知正確、分析正確,然后才能作出比較理性的決策,所以人對信息使用的這個過程,其實是非常復雜的。
現(xiàn)在的確是人在很多上面的認知比機器(從廣義上來講)要厲害。但機器好處是:在它的認知范圍內,它犯錯的可能性比人要低,機器的最大特點是不知疲憊,比如給它一個詞典,它一下就全部學完了,取決于這個詞典、教材編得好不好,如果編得好的話,這個機器就會有很高水準,如果編不好的話,這個機器也就學不好了。 人工智能發(fā)展的浪潮 第一波浪潮
第一波浪潮主要引領的是計算智能。這波浪潮起來之后,沒過多久就消散了,因為很快就遇到瓶頸了,雖然機器能做事情,能幫忙證明一些定律,但在實用性上并沒有太大的突破,比如機器無法跟人交流,無法識別圖像,它最大的作用就是計算智能。
第二波浪潮
接下來是90年代前后,就是遞歸神經網絡的誕生,它研究如何將圖像識別出來,最大的特點就是能整個舒展,前后上下文連接在一起,然后用神經網絡去識別,但效果并不是很好。
遞歸神經網絡在90年代的中國掀起過一波浪潮,當時整個中國研究人工智能的那一批人都把精力鋪在了上面,但受限于當時計算機的水平,而且當時遞歸神經網絡還有一些數學問題解決得不夠好,所以這個問題看似是看到一個巨大的希望,一個突破口,但沒有真正在使用方面得到一個很大的應用。
這是第二波浪潮,遞歸神經網絡興起很快,但直到90年代后面慢慢沒有人再提這個概念了。
第三波浪潮
就是深度學習的誕生。
神經網絡是RNN(循環(huán)神經網絡),現(xiàn)在是CNN,CNN是卷積神經網絡。
其實物理學也有一些類似的,如果在一個空間處理不掉一些東西,就把它轉換到另外一個空間。比如在信號學里面,經常要取一些信號波段,它有點類似,就是把它分層,分成很多層之后,發(fā)現(xiàn)可以識別出不同的信息。 CNN(卷積神經網絡) 深度學習好在哪里呢?它是2006年提出來的,提出來之后做了圖像方面的簡單處理,直到2008年的時候都只是在學術界轟動,在業(yè)界里面沒有多大轟動;但是到了2009年,這個東西一下子爆發(fā)了,開始有工業(yè)界的人用它去做各種各樣的嘗試;直到2013年徹底爆發(fā)。
這是深度學習迎來的天時、地利、人和的一個大環(huán)節(jié)。
這是人工智能史上的三次浪潮以及三次浪潮的原因。
牢記RNN、CNN,為什么?有一個好處,就是當你以后再跟人家去談神經網絡的時候,你只要把這兩個概念甩出去,保證讓他們直接都說不出話來。
大量做統(tǒng)計的或者做數據挖掘的,都號稱現(xiàn)在所謂的人工智能的最大區(qū)別,在于這個公司是否掌握了深度學習技術。 深度學習為什么那么難呢?現(xiàn)在還是人工智能發(fā)展的早期,可能再往后兩年這個東西就沒有那么難,比較容易應用到很多領域里,但目前在這個階段還很難。比如我們公司做的東西,也不可能一個場景一個場景去應用,很難將文本理解應用到很多領域去。 所有的機器人都可以代替人類? 很多人覺得人工智能好像很恐怕,是不是所有的機器人都可以代替人類?其實不是這樣的。
1、人工智能的解釋性差
解釋性差是什么意思?
舉個例子: 比如AlphaGo下一步棋下到這里了,國內很多頂級的九段高手說:“我都想跟AlphaGo學這一步棋了,這一步棋下得真的是妙?!钡f實話,如果AlphaGo是個人的話,它就是一個傻子,因為它根本不知道這步棋妙在哪里,對它來說只是下了一步棋,它的思維方式跟人的思維方式完全不一樣,人可以解釋這步棋妙在哪,但AlphaGo根本解釋不出來。 所以這是目前人工智能遇到很大的問題,為什么?它的問題在哪呢?它把很多信息轉化到人類根本無法理解的一些信息層去處理了,因此,機器人目前思考的方式是人類根本不可能理解的這種方式,它不具備這些。
再舉個例子: 商學院是面對社會,跟人去打交道的,做法一定要具有可解讀性,所以目前但凡是要跟人聯(lián)手操作,需要去交互的情況下,人工智能都很難突破,因為要如何讓機器人理解人類?這個被稱之為類人智能,類人智能是一種通識性的東西,它能夠懂很多東西,而且能夠快速自我學習。
目前對人工智能來講,可能還有很長的路要走,我覺得至少十年內是很難的事情。
2、理解人類的能力差
我們隨便說一句話,或者聯(lián)系對話的上下文,它要如何理解這一塊是目前做得非常差的,甚至學術界都不知道該怎么去做這個事情。
3、邏輯能力不強
什么叫邏輯?
舉個例子:我為什么來這里?我為什么今天來這里跟大家分享?這是有很強的邏輯關系的。
但是,我們日常工作大部分事情邏輯并不是那么強:比如我開車,那里有紅燈我就停車,這是簡單邏輯;但遇到復雜問題的時候,比如那里有個綠燈讓我開,然后有個警察打個手勢讓我停,這個時候機器怎么判斷?
這還不是復雜的事情,真正復雜體現(xiàn)在哪里呢?比如我們公司有個項目是跟法律公司合作的,是研究法院的判決書,原告遇到什么事告了被告,被告反訴又提供了證據,法官又認罪事實一二三,駁回事實一二三,最后來了一個判決,這是一個強邏輯。 這個場景下邏輯的應用就非常重要了,到目前為止全世界范圍內對于邏輯的應用都非常不成功,即便是語言邏輯,就是主謂賓這些東西判斷,機器在英文里面識別準確率是百分之七十六點幾,中文里面做得最好的是哈工大的計算機學院院長劉挺教授,他也只做到比英文落后兩個點。當然,他也說他已經很驕傲了,因為中文實在比英文難。
我剛才說感知智能到認知智能,然后再到分析、決策,這中間每一步都是七十四點幾的話,那么結果的準確就非常差了,只有百分之二十多,所以我們現(xiàn)在追求準確率到百分之九十幾,這樣才比較好。
4、缺乏意識
媒體采訪會搞一些嘩眾取寵的東西,比如人工智能會毀滅人類嗎?然后這個問題就會被炒得很火,雖然人工智能的發(fā)展總是超出預期,但我有時候在想:意識到底是個什么鬼東西?怎么才能讓機器擁有意識呢?我覺得這是不可能的事情。
意識是一種物質,信息是什么?信息也是一種物質,它是有重量的,人死之后,信息到底以怎樣的形式存在?意識呢?我自己很不看好人工智能發(fā)展能夠讓人工智能有意識。
至于許多人的擔心,人工智能會不會毀滅人類。我認為,在人工智能超級發(fā)達之后,如果有人人為地為這種“超級人工智能”植入一些意識,甚至“毀掉人類一切”這樣的指令,是有可能的。
人工智能主動發(fā)現(xiàn)電腦系統(tǒng)各種漏洞,這個很有可能。但要是毀滅人類,歸根到底它的意識是屬于人的意識,不是機器的意識,我看不到機器人產生意識的可能,除非像電影上似的一道閃電閃過。 目前世界上人工智能的產業(yè)和生態(tài)的問題 人工智能技能分四個階段:
1、計算智能
計算智能是最開始驅動人工智能一個很重要的東西。
為什么叫計算智能而不叫別的?因為那個時候所有的電腦軟件游戲,用的都是窮舉法,就是把所有可能性算出來,算到結果。所以基本上屬于算的都是計算智能和博弈論,博弈論出來很久了,那個時候等于屬于利用計算機的計算智能再加上博弈論作出博弈。
2、感知智能
能夠像人一樣感受到外面的信息,這個信息一共分為三類信息:圖像、聲音、文字。當然還有一種信息,目前完全被人類忽略,比如腦電波、皮膚的感應等嗅覺、味覺這一塊的信息。
3、認知智能
人工智能不僅要能識別這個文字是什么,這個圖像是什么,這個聲音是什么,還要能夠去識別它背后的含義。AlphaGo之所以能夠引起那么大轟動,就是因為它在圍棋的認知能力上已經超過了人類,還有谷歌的無人駕駛、訊飛的機器翻譯、今日頭條的新聞推薦等。
4、類人智能
這個屬于人工智能希望達到的最終的目,但目前只能在電影里面看到:里面的機器人產生了類人智能,甚至有點真的智能,它產生了愛情,開始理解什么是愛,什么是喜歡,那是比較理想化的,目前人工智能其實都是集中在這個階段。
目前所有做得大的公司,臉書、谷歌等都希望能夠達到類人智能,但是目前想達到這一步難度非常大,甚至我覺得一家公司不可能做到,所以后來有些公司就做了一些open AI,比如我們公司做的智能東西,通過結合的方式把它們全部串在一起。還有谷歌、臉書、微軟都推出了開放接口,希望大家把技術全部傳到上面,用它們的技術,讓它們能夠掌握更多理論智能。
這是人工智能的四個階段。 為什么人工智能在2016年爆發(fā)? 可以說是天時地利人和。
1、云計算的大規(guī)模普及,讓應用成本大幅度降低
舉個例子: 做人工智能必然要有大量的數據,大數據從哪里來?從外面獲取需要成本,我們的公司因為云計算普及,這塊成本降低了50倍,這是很實用的一個數據,所以云計算對我們做人工智能有極大意義。
2、計算能力突破
電腦里面的芯片都是CPU,深度學習把計算機的計算速度提高到160-250倍,數據哪來?百度首席科學家吳恩達就提升到了160倍,我們公司其實已經提升到255倍,而是也是用類似的技術。這意味著什么?意味著我們以前要花200多臺服務器的錢,現(xiàn)在只要一臺服務器搞定,一臺服務器12萬,這個成本讓我們有了跟大公司去抗衡的資本,沒有這個東西根本搞不定。
3、互聯(lián)網催生大數據
各種數據都有大量的人在整理。
比如做數據平臺化戰(zhàn)略,數據的積累比原來快得多,而且兇猛得多。2016年人工智能爆發(fā)都是因為這方面的技術,還有文本的基本理解,文本轉化為矢量的計算,這些東西的關鍵技術都在2016年取得了突破,2015年比較成熟,然后爆發(fā)。
2016年人工智能的爆發(fā)確實有非常多天時地利人和的因素在里。我認為“人工智能+”是比“互聯(lián)網+”要更加兇猛的一個東西,它未來會滲透到每一個行業(yè),未來我們做的很多事情都會有人工智能來去幫我們優(yōu)化。
企業(yè)如何實施人工智能 隨著人工智能、人機交互和高速計算技術的發(fā)展,很多人的工作正逐漸被電腦取代,甚至很多新聞說百分之四十六或者百分之七十幾的未來會被取代,現(xiàn)在看來真的不是危言聳聽。 因為機器人的效率和分析能力,尤其在垂直行業(yè)的發(fā)展越來越強,甚至強到我們沒辦法跟機器人比,因為它不累,而且它的知識量、計算速度遠超人類。
舉個例子: 有人覺得機器人沒有創(chuàng)意,其實我覺得機器人最不缺的恰恰就是創(chuàng)意,為什么?我研究谷歌如何優(yōu)化機器人的創(chuàng)新過程,研究了兩年多,創(chuàng)新這個模型,在數學里面就是隨機模型。什么叫創(chuàng)新?就是你有很跨界的背景,然后再加上非常發(fā)散的思維,就很容易產生新的有用的東西。創(chuàng)新就是新的、有用的。 所以,未來人工智能的革命確確實實在發(fā)生。
新興市場有一個名字叫作KWA,就是知識工作自動化機器人。原來的工業(yè)革命是蒸汽機代替人做事,但它做的是體力勞動,人工智能是讓機器人代替人去做腦力勞動的事,尤其是職業(yè)規(guī)劃、HR投資助理等,很多基礎性的知識,一些重復、單調的。所有那些你覺得完全依靠經驗,腦力勞動、重復單調覺得很沒有價值,對自己沒有能力提升的,基本上都屬于會被KWA機器人所替代的。而且這個市場規(guī)模非常大,有報告預計在未來十年后這個市場將會達到5.2萬億到6.7萬億美金,相當于中國一年的GDP。 人工智能三大障礙 1、積累海量的行業(yè)數據
什么叫海量的行業(yè)數據?這個數據不是存儲有多少的事。
電信運營商的數據量非常大,絕對是PB(PB等于1024TB)級別的,但是他們的數據結構并不是特別復雜。而iPIN的數據存儲量雖然并不特別大,但是關于人的數據是極為復雜的,僅可量化維度就有幾百維度,算上知識文本的維度就非常高維了。這么大的數據量積累起來是非常不容易的。 有了海量數據之后,還必須要有一個好的架構來存儲數據。往往我們會發(fā)現(xiàn),一些公司的數據被存儲在不同的部門,而各個部門之間沒有相互打通,這樣的數據對于決策的參考和幫助價值其實是非常有限的。 2、擁有掌握人工智能核心技術的人才
人工智能的核心一定屬于數據。
這是最近這兩年我被問得最多的問題,尤其最近有一個房地產公司想成立一家合資子公司,想用我們這個技術去顛覆房地產技術匹配的問題,當時提的要求是錢沒問題,但要求給他組建一個人工智能團隊,我一聽就直接拒絕了。
這不可能,我自己花這么長時間組建團隊,以我的能力也只能組建一個,要我?guī)湍憬M建一個,我覺得這是不可能的事情,如果你們是大公司,有足夠的資金實力,我覺得還是可以嘗試的。
以我對很多國內大公司的了解,人工智能人才主要還是聚集在美國,中國國內培養(yǎng)頂尖的人工智能人才,基本遇到了一個很苦逼的環(huán)境,中國整個數據環(huán)境的生產可以說落后美國很多年。
90年代,美國做了一件事情,很多大的公司都實現(xiàn)了數據戰(zhàn)略化。舉個例子:美國的沃爾瑪,93、94年還有一家很大的超市,其實根本不比沃爾瑪小,但是它卻輸給了沃爾瑪。因為沃爾瑪用了ERP系統(tǒng),將所有公司資源全部數字化了,它能夠知道自己的資源使用率是多少,成本是多少,通過ERP降低公司整個企業(yè)程序,這對于這種超市物流管理非常重要,所以數字化對于商家有極大的幫助。
美國從90年代到2000年初有一批大的公司商業(yè)化,他們要求BI,就是Business Intelligence(商務智能)要做到第四層級,要全部打通那個層級,才能實現(xiàn)全公司能夠達到商業(yè)智能的水平。 但目前全中國真正達到BI第四層級的公司,我目前知道的只有兩家:阿里和騰訊,騰訊可能還處在三級吧,阿里則是一個實現(xiàn)了百分百第四級的公司。 阿里2009年引入了一個人,這個人后來給阿里巴巴建立了ODPS(大數據計算服務)的數據通道,它能夠讓阿里將任何業(yè)務上實時產生的業(yè)務,能夠實時送到通道,而且送到全儲道和最需要的地方去。 這個事情是非常牛逼的事情,當時我知道這個結果之后非常驚訝,阿里居然做成了,它做成這個之后,就可以有和谷歌、亞馬遜叫板的資格,尤其它還建了阿里云。阿里云是我見過最像亞馬遜的真正的云計算的公司,阿里在建設數據人才可以說是不遺余力。
3、管理層擁有數據意識
這個不說了,如果老板想干嘛就干嘛,如果老板不想干嘛,你怎么說都沒有用。 很多公司不重視數據,不是說老板認識不到數據的作用,而是可能他自己也不清楚這個數據做成之后到底會給公司帶來多大收益,因為做任何事情都要考慮投入產出比,所以當時在不是很了解收入產出比的情況下做這個事情是很痛苦的。 公司決定為任何一項事情引進人才都涉及時間、金錢方面的投入,要想項目真正運轉得好,還需要引進的人才能夠推動落實。這就導致另一個尷尬,因為數據人才都是很貴的,市場的供需比嚴重不平衡,本身就是一個成本很大的事情,萬一別的部門不配合,事情就難以推動,公司的投入也就打了水漂。 招聘的環(huán)節(jié)以及人工智能的展望 1、招聘
招聘是非常長的鏈條,要從最開始做人力資源規(guī)劃到預測。
什么叫人力資源規(guī)劃?
大多數是公司現(xiàn)在要做什么?下一步要做什么?每個團隊分配怎樣的人力資源?比如給你幾個人,報過來審批,大概是這樣一個流程。 在美國有一家公司,它專門幫公司做人力資源規(guī)劃,它是幫你分析你的競爭對手的人力資源規(guī)劃是怎么做的,通過那個來指導你怎么做。所以它是面向CEO層的,它真的把人力資源當成戰(zhàn)略去做,而不是支撐業(yè)務去做。
我覺得未來人力資源方面有很大提升空間,要去規(guī)劃,去提高預測的準確性。這是我們公司目前也在做的事情。
2、培訓
為人工智能的老師量身定制一些課程,這塊或許跟教育有關。
比如E-Learning(在線學習系統(tǒng))本來就是很大的市場,但目前為止也沒有看到特別好的實例,雖然各個公司都在投入在線教育,E-Learning也非常深入地在研究人工智能,但目前為止并沒有看到特別好的效果。機器不能理解人,你要如何講得人能喜歡聽?比如新東方的老師真的很牛嗎?其實未必,但他們很會講課,能夠激發(fā)你學習的興趣,這是人工智能目前做不到的一點。
3、績效
可以實現(xiàn)高度自動化學習化,包括美國在內的很多學校教育都在做新的嘗試:不用再考試,通過平時做作業(yè)打績效分。
對人的績效能不能不要去定季度的Q1、Q2,而是采取平常的工作,根據平常很小的一些任務就給自動化的評估,這樣更能調動人工作的積極性。
4、薪酬報告
這塊不屬于人工智能,更多是屬于大數據。
比如我們現(xiàn)在掌握著全中國5000多萬的薪酬數據,這些薪酬數據要怎樣更好以一種個性化的方式存在?我們目前在做一種嘗試,不是看什么薪酬報告,而是找到跟這個最像的人,他們在哪個公司,拿多少錢。通過這種方式去做一些動態(tài)、實時、個性化的東西,這也許是未來一個大的機會。
5、員工關系的維護
國外有一家公司可能才成立三年不到,去年他們的高管來我們公司訪問,問我們:“你認為它進入中國可能性大嗎?”因為他們在美國才成立三年不到,就已經發(fā)展到了3000多員工,一年盈利20億美金左右的規(guī)模,這非???,非??鋸垺?/span>
他們將整個員工入職的這一塊全部包干了,員工入職流程有很多東西,比如各種社保、醫(yī)保,全部都做到系統(tǒng)化里,這樣公司省事,員工也有選擇,同時也有更多社保、醫(yī)保公司給它付費。
中國社保、醫(yī)保這一塊是國家控制的,可能不會像美國有這么大的市場。不過國外確實有很多在做員工預測離職的分析。比如我原來聽說的:如果你發(fā)現(xiàn)一個員工老是周三、周四請假,那這個員工是要走了。 目前全球人力資源的生態(tài) 1、人才的獲取、招聘、入職
人才的獲取、招聘、入職,屬于公司內的人才管理,HR的核心管理,這個是國外的市場。
我當時在美國一直在研究這件事情,回國之后給我的感覺是:國內的人力資源市場跟國外的人力資源市場感覺不在一個星球上。
為什么呢?
國外公司大量使用各種軟件系統(tǒng),國內發(fā)工資還是人在發(fā),美國全部是電子化了,當然他們沒有人敢欠稅務局的錢。每一塊領域都有很多公司在做一些智能化服務。每個領域我覺得都有很大的機會。我當時的判斷是,我最近對美國市場不是那么熟了,我感覺那個時候兩國在人力資源系統(tǒng)的發(fā)展相差有七、八年之大。
2、面試評估
這一塊的智能化在中國做得特別低,你要對這個做背調(背景調查),這個人的教育經歷和工作經歷是不是真實的,其實在美國一下子就可以搞定,在中國就很難搞清楚了,其實成本并不高。
舉個例子: 騰訊最近跟哪家公司簽約了,需要委托別人去做背調。其實背調在美國已經屬于高度自動化了,直接把你的搜索ID給我,我就能查到你的經歷是不是真的,在中國技術上是完全能夠實現(xiàn)的。其實在征信行業(yè)已經實現(xiàn)了,我們在想這塊能不能有個很大的優(yōu)化。
3、談薪錄用,背調
有些公司在這一塊會做,但中國一半屬于絕對OK了再去做背調,薪資未來是可以信息化的,可以變得更強。
4、入職
這一塊在國內有一家公司開始在嘗試,但做得也不大。 5、考核
我是不專業(yè)的,我經常也跟別人交流考核到底應該怎樣做,因為我發(fā)現(xiàn)隨著公司規(guī)模、業(yè)務性質、公司文化的不同,考核也需要不斷去改變,我感覺這塊可能不是數據能夠簡單解決的問題。
謝謝大家! 更多人工智能相關文章點擊以下鏈接 |
|
來自: by支離益 > 《互聯(lián)網思維》