從「能用」到「有用」,從「開源」到「開放」,百度 AI 十年的發(fā)展之路。 三十年只做了一件事情是種怎樣的體驗(yàn)? 對王海峰而言,他的三十年都在搞 AI。第一個(gè)十年在高校做 AI 研究,第二個(gè)十年在外企、在創(chuàng)業(yè)公司嘗試將 AI 技術(shù)落地成具體的產(chǎn)品應(yīng)用。 第三個(gè)十年,王海峰加入百度,先是在百度內(nèi)部搭起 AI 基礎(chǔ)研究的架構(gòu),接著開始負(fù)責(zé)百度搜索業(yè)務(wù)的智能化升級,之后又擔(dān)任了百度 AI 技術(shù)平臺(tái)體系總負(fù)責(zé)人,如今成為百度的 CTO。 今年,正值哈爾濱工業(yè)大學(xué)建校百年,哈工大出版社出版了一系列關(guān)于校友的叢書,其中一本便是關(guān)于王海峰——《AI 已來:讓中國 AI 走向世界的王海峰》。這本書記錄了王海峰從業(yè) AI 三十年的故事。在書中,他說,「我始終相信,科技能夠改變世界,而 AI 則是我們這個(gè)時(shí)代核心的生產(chǎn)力」。 王海峰身上有不少標(biāo)簽。比如說他是百度最勤奮的高管,因?yàn)閺膩聿凰瘧杏X,每天七點(diǎn)就開始工作。比如說,他是一個(gè) AI 的「擺渡人」,三十年一直在 AI 領(lǐng)域「解碼」,做出成熟的研究成果,又將這些成果「編譯」落地到產(chǎn)業(yè)中。王海峰一直希望做到「學(xué)以致用」。 1999 年博士畢業(yè)時(shí),他參加了一場微軟亞洲研究院的宣講會(huì),主講人是李開復(fù)。會(huì)后,李開復(fù)問他對自己職業(yè)選擇有什么打算。他說,「我做了這么多年研究,現(xiàn)在想讓這些東西被更多人使用?!褂谑?,他在李開復(fù)的建議下,加入微軟亞研院。 2009 年 8 月,百度世界大會(huì)召開。會(huì)上,百度提到了一個(gè)前沿的技術(shù)理念——「框計(jì)算」。王海峰坦言自己得知這個(gè)消息時(shí)的欣喜?!竸e人可能只看到這是一個(gè)新的詞匯,但我看到的是框計(jì)算背后,它的實(shí)現(xiàn)需要我最擅長的一些技術(shù)。」 這些技術(shù)涉及 AI,需要調(diào)用大量以自然語言處理為代表的人工智能技術(shù),而這些正是王海峰主攻多年的領(lǐng)域。于是,他決定加入百度。 在外界看來,百度是一家搜索公司。但實(shí)際上,這家公司布局 AI 業(yè)務(wù)到今天也是整十年了。這十年,百度一直在做兩件事情,將內(nèi)部的 AI 技術(shù)研究梳理、統(tǒng)籌成一個(gè)個(gè)平臺(tái),接著又將這些技術(shù)通過平臺(tái)開源開放給各個(gè)產(chǎn)業(yè),實(shí)現(xiàn)產(chǎn)業(yè)的智能化。 百度是如何做 AI 的?這家公司的理念是什么?百度如何參與到 AI 新基建中?AI 又是如何影響改變百度的?圍繞這些問題,近期極客公園創(chuàng)始人張鵬與百度 CTO 王海峰有過一次對話。以下是此次對話的核心內(nèi)容,由極客公園整理。 百度 APP 搜索「張鵬對話王海峰」觀看完整視頻 百度 AI 的開源開放張鵬:你曾經(jīng)提出過一個(gè)觀點(diǎn),百度的 AI 要堅(jiān)持「從開源到開放」,這個(gè)兩個(gè)詞大家聽起來會(huì)感覺像是一個(gè)詞,能不能展開講講這其中的含義? 王海峰:2010 年之前,我們做 AI 主要是為百度的產(chǎn)品,比如為搜索服務(wù)。那個(gè)時(shí)候還談不上開源開放,只是說搜索遇到了什么問題,有什么需求,我們就用 AI 技術(shù)來優(yōu)化。但是,在 AI 應(yīng)用到搜索之后,我們發(fā)現(xiàn)還有很多產(chǎn)品也能用這些技術(shù),比如地圖、輸入法等等。 如果針對每個(gè)產(chǎn)品都單獨(dú)開發(fā)這樣一套技術(shù),顯然效率不高。所以到 2013 年,百度就提出要把這些技術(shù)平臺(tái)化。每個(gè)產(chǎn)品、每個(gè)工程師都能方便調(diào)用。這時(shí)候還是在百度內(nèi)部。之后,這些技術(shù)逐漸積累成熟,除了百度,外界其他企業(yè)、行業(yè)也有使用的需求。 更重要的一點(diǎn)是,我們看到人工智能的應(yīng)用絕不局限于搜索引擎,不局限于互聯(lián)網(wǎng),而應(yīng)該有更廣闊的應(yīng)用。我們希望各行業(yè)都應(yīng)用起來。所以,我們就把它開源開放出來,大家一起推動(dòng)人工智能去改變產(chǎn)業(yè)。 比較典型的案例有百度飛槳,這是一個(gè)完全開源的平臺(tái),很多工程師可以基于這個(gè)平臺(tái)來開發(fā)自己的產(chǎn)品。還有百度大腦,這個(gè)平臺(tái)已經(jīng)開放 260 多項(xiàng)能力。這其中就包括比如計(jì)算機(jī)視覺,可以識(shí)別文字、票據(jù),里面有專門的已經(jīng)做好的模型,方便工程師調(diào)用和開發(fā)產(chǎn)品。 張鵬:總結(jié)起來,開源更多的是在代碼層級,開源出來,大家知道是怎么回事了,然后再做自己的建設(shè)。開放其實(shí)是把 API 做好,工程師可以直接調(diào)用已有的成果,更有效率。 王海峰:對,開放就是有更多配套工具,比如我們開放了模型庫,也開發(fā)了套件、工具組件,有非常多的東西,大家基于平臺(tái)各取所需。 張鵬:AI 現(xiàn)在走到更多產(chǎn)業(yè)里,所以我們對這項(xiàng)技術(shù)的理念,也要從當(dāng)年技術(shù)人員開源的思想,走到商業(yè)世界的開放思想,必須要完成這么一個(gè)跨越。 王海峰:這個(gè)你說得特別好。我們之所以這樣一步步走,也跟需求相關(guān)。這個(gè)也從另一個(gè)層面印證了,現(xiàn)在的產(chǎn)業(yè)已經(jīng)大規(guī)模在擁抱人工智能,對人工智能有方方面面的需求。 AI 十年,四個(gè)節(jié)點(diǎn)張鵬:百度做 AI 也十年了。在這個(gè)進(jìn)程中,有什么讓你覺得特別難忘的節(jié)點(diǎn)嗎? 王海峰:這 10 年我經(jīng)歷了四個(gè)階段。第一個(gè)階段就是從 2010 年我加入百度到 2013 年。這幾年,我主要做的事情是給百度 AI 各方面的能力打基礎(chǔ)。比如自然語言處理、機(jī)器翻譯、語音、視覺,也包括數(shù)據(jù)挖掘、知識(shí)圖譜等等。這些基礎(chǔ)性的東西都是這四年做的。接近 2013 年底的時(shí)候,那個(gè)時(shí)候我們做平臺(tái)化,這些東西已經(jīng)比較成熟了,可以形成一個(gè)平臺(tái)了。第一階段就基本上完成使命了。 第二階段開始于 2014 年 1 月份,我轉(zhuǎn)向負(fù)責(zé)搜索業(yè)務(wù),這是百度的核心業(yè)務(wù),我們?nèi)轿坏匕阉阉饕嬗?AI 改造了一遍。這也就是所謂的智能化升級。對我個(gè)人而言,這也是我真正下場用 AI 來做一個(gè)大規(guī)模的產(chǎn)品。 這個(gè)階段也不只是做搜索的智能化,我們同時(shí)也在進(jìn)行搜索的移動(dòng)化,像是信息流也是這期間做起來的。還有小度音箱這些,也是從我們團(tuán)隊(duì)里孵化出來的。這個(gè)階段做了三年,差不多到 2017 年結(jié)束。在這個(gè)過程中,AI 逐漸成為了百度非常重要的戰(zhàn)略。 2017 年,我開始負(fù)責(zé)百度的 AI 技術(shù)平臺(tái),成立了 AIG,也就是 AI 技術(shù)平臺(tái)體系。第三階段也是從這里開始的。我們開始對百度的 AI 平臺(tái)進(jìn)行全面的升級。我們不只是想做一個(gè)純技術(shù)平臺(tái),還希望做一個(gè)軟硬件一體的工業(yè)大生產(chǎn)平臺(tái)。 這是一個(gè)根本性的變化,我們不僅會(huì)研究算法、算力、數(shù)據(jù),同時(shí)也做了兩款芯片。大概花了兩年半的時(shí)間,我們把百度的 AI 平臺(tái),升級成更適合更廣泛的 AI 工業(yè)大生產(chǎn)應(yīng)用。 第四階段從 2019 年下半年開始。我除了負(fù)責(zé) AI 平臺(tái)之外,也開始負(fù)責(zé)智能云。很多人對這個(gè)調(diào)整有疑問,畢竟作為 CTO 管技術(shù)就好了,為什么要來負(fù)責(zé)云業(yè)務(wù)。因?yàn)?AI 技術(shù)最終還要落地,而落地在百度內(nèi)部當(dāng)然我們有完善的平臺(tái),各個(gè)產(chǎn)品都可以對接這個(gè)平臺(tái)去用。 對外,我們需要有一個(gè)可以支撐產(chǎn)業(yè)的應(yīng)用平臺(tái),這個(gè)就是以智能云為依托,基礎(chǔ)是百度大腦,上面我們有各種平臺(tái),有各種產(chǎn)業(yè)應(yīng)用,有一個(gè)完整的智能云來支撐這個(gè)產(chǎn)業(yè)。當(dāng)然我去年負(fù)責(zé)智能云的時(shí)候「新基建」這個(gè)詞沒像現(xiàn)在這么火,現(xiàn)在大家都知道新基建了。其實(shí)新基建里面各種概念和我們智能云是非常契合的。 張鵬:百度現(xiàn)在非常重視技術(shù)落地。但一個(gè)技術(shù)從能用到有用,只是一個(gè)字的不同,但差別卻很大。技術(shù)往下落的時(shí)候很復(fù)雜。比如說在科研領(lǐng)域把一個(gè)東西跑通了,能用了,但在產(chǎn)業(yè)層面,會(huì)遇到成本、效率等各種問題。這些您是如何看待的? 王海峰:現(xiàn)代產(chǎn)業(yè)分很多環(huán)節(jié),任何一個(gè)環(huán)節(jié)都可以產(chǎn)生成功的公司,這取決于公司的定位。做項(xiàng)目公司有做項(xiàng)目的價(jià)值,最終技術(shù)在產(chǎn)業(yè)落地需要做項(xiàng)目。做平臺(tái)也有做平臺(tái)的價(jià)值。 我們做一個(gè)平臺(tái),你可以認(rèn)為是我們像生產(chǎn)電一樣,我們把這些 AI 的能力生產(chǎn)出來,大家可以方便地基于這個(gè)開源開放的平臺(tái)來用。同時(shí)我們也會(huì)在某一些行業(yè)里面深入去做,比如在金融、醫(yī)療、能源、智慧城市等有一些領(lǐng)域我們也深入地去做。 做 AI 全科生張鵬:最近五年,AI 行業(yè)都是在一個(gè)非常高的熱度上。你是 AI 行業(yè)三十年的從業(yè)者,但這幾年可能你的學(xué)弟、學(xué)妹,比你晚入行的人一上來就做了一家 AI 公司,并且有些市值還很高。你會(huì)不會(huì)覺得自己當(dāng)年有些生不逢時(shí)? 王海峰:沒有,我覺得我生活的時(shí)代挺好的。我經(jīng)歷了 AI 從早期還在實(shí)驗(yàn)室到逐漸步入行業(yè)的全過程。每個(gè)時(shí)代的人都有不同的使命。我們這代人,就是把 AI 技術(shù)的基礎(chǔ)打好,能推動(dòng)它的進(jìn)步,能夠真正進(jìn)入工業(yè)大生產(chǎn)。 對我而言,能夠?yàn)檫@個(gè)目標(biāo)做出一些貢獻(xiàn),我已經(jīng)很滿意了。反過來說,百度也積累了很多 AI 技術(shù)。這些技術(shù)如果單獨(dú)拿出去接受市場評估的話,可能每一個(gè)也可能成為獨(dú)角獸公司。當(dāng)然,我們沒有這個(gè)打算。 一方面,百度很看重 AI,這是百度非常重要的核心戰(zhàn)略。另一方面,這些技術(shù)只有放在一起,形成一個(gè)大的平臺(tái),才可能支撐起更廣泛的應(yīng)用。因?yàn)?,我們?shí)際的工業(yè)大生產(chǎn)中,往往都是各種技術(shù)綜合的應(yīng)用。 張鵬:這就是說,百度要做 AI 的全科生。 王海峰:對,往往一個(gè)功能的實(shí)現(xiàn)不止需要一種技術(shù),而是若干技術(shù)組合起來,并且這些組合不是簡單的拼接,組合本身也是有技術(shù)含量的。只有這樣才能實(shí)現(xiàn)在一個(gè)場景中真正落地。 比如現(xiàn)在用戶量很大的小度音箱。它背后可能把我們所有的人工智能技術(shù)都用上了。比如,語音、視覺、自然語言處理、知識(shí)圖譜等等,甚至包括搜索能力都集成在里面。 張鵬:AI 全科生還是非常重要的,尤其是你希望解決更綜合的問題,希望在更多場景落地,而不是局限在某一單一領(lǐng)域。這讓我想到另一個(gè)問題。現(xiàn)在,在一些比較垂直領(lǐng)域已經(jīng)長出了很多高價(jià)值的 AI 公司。這里面,你覺得會(huì)有泡沫存在嗎? 王海峰:這要看我們怎么理解泡沫。人們對 AI 技術(shù)發(fā)展預(yù)期的認(rèn)知是有泡沫的,可能會(huì)有些高估。的確,AI 現(xiàn)在能夠解決很多問題,但它并不是萬能的。從投資的角度看,大量投資進(jìn)入 AI 相關(guān)的領(lǐng)域,肯定能產(chǎn)生很好的結(jié)果,也有很多投資可能最后打水漂了。 一個(gè)事物發(fā)展的規(guī)律就是這樣。整個(gè)社會(huì)并不期望每一筆投資都能成功。但這些投資的確會(huì)推動(dòng)整個(gè) AI 技術(shù)和產(chǎn)業(yè)的進(jìn)步。站在未來看,AI 的未來一定是可期的,一定會(huì)給人類社會(huì)帶來很多進(jìn)步,給我們的生活帶來很多好的改變。 張鵬:所以說,最值得擔(dān)心的,其實(shí)是我們對于 AI 現(xiàn)有能力的認(rèn)知存在錯(cuò)誤的預(yù)期。 百度如何參與新基建?張鵬:今年兩會(huì)之后,新基建這個(gè)詞就特別熱,人工能又是新基建里很重要的領(lǐng)域。關(guān)于新基建,你是如何看待的? 王海峰:從我個(gè)人的角度看,我認(rèn)為這是水到渠成的事。國家對 AI 的重視不是從今年才開始的,其實(shí)很早之前就已經(jīng)布局了很多。但新基建這一步仍然非常重要。它明確定義了新基建的 AI 到底能做什么,這會(huì)促進(jìn)行業(yè)更有序地發(fā)展。 張鵬:作為百度的 CTO,你需要針對面向未來的技術(shù)做投入。這些投入最終還是要看商業(yè)回報(bào)的,畢竟百度是一家上市公司。在不同的階段,AI 給百度帶來的真實(shí)的商業(yè)價(jià)值是怎樣的? 王海峰:目前,通過 AI 能力服務(wù)一個(gè)客戶,顯然是有薄利的,但我認(rèn)為它的發(fā)展空間還很大,還有很大的發(fā)展空間可以服務(wù)更多客戶,為社會(huì)帶來更深刻的改變。 張鵬:未來三到五年,百度會(huì)成為一家怎樣的公司? 王海峰:我們要用科技讓復(fù)雜的世界更簡單,我們也在致力于做這樣的事情。比如說讓你獲取信息更簡單,讓你跟 AI 系統(tǒng)交互更簡單,讓你的交通出行更簡單,讓你的產(chǎn)業(yè)智能化升級更簡單。大方向上,我們是一個(gè)人工智能的平臺(tái)型公司,這個(gè)是很明確的。 張鵬:本質(zhì)上,百度就是繼續(xù)會(huì)做一家用科技創(chuàng)造更大價(jià)值的公司。就像我們常常提到技術(shù)信仰,這個(gè)信仰一是說相信技術(shù)能解決問題,二是說我會(huì)選擇用技術(shù)來解決問題。 感謝王海峰今天的分享。如果大家還對相關(guān)話題感興趣,可以看看《AI 已來:讓中國 AI 走向世界的王海峰》,這本書可以在京東上購買。這里面有王海峰看到的 AI 的發(fā)展歷史,也有他期待的 AI 的未來。 圖源:極客公園 |
|