編者按:從數(shù)學(xué)博士到投身計(jì)算機(jī)科學(xué)研究,微軟亞洲研究院機(jī)器學(xué)習(xí)組主管研究員陳薇將理性嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)思維融入到了工作與生活的方方面面:在研究領(lǐng)域,陳薇以她堅(jiān)實(shí)的數(shù)學(xué)背景與研究團(tuán)隊(duì)一起從事機(jī)器學(xué)習(xí)理論和算法優(yōu)化的研究,為機(jī)器學(xué)習(xí)的加速發(fā)展奠定了有力的理論基礎(chǔ);在生活中,她也用數(shù)學(xué)思維來(lái)不斷優(yōu)化自己的人生。 數(shù)學(xué)博士陳薇是位知性、溫婉的女性研究員,常年的數(shù)學(xué)思維訓(xùn)練,讓她很善于用各種模型去解釋生活中的大小問(wèn)題。在她看來(lái),“如果把人生看成一個(gè)優(yōu)化問(wèn)題,那么只有影響力能成為其目標(biāo)?!弊赃x擇做計(jì)算機(jī)科學(xué)研究的那一天起,研究的影響力便成為陳薇追尋的目標(biāo)。在加入微軟亞洲研究院后,陳薇與合作者們一起從理論上理解機(jī)器學(xué)習(xí)方法并改進(jìn)算法,先后在排序?qū)W習(xí)、博弈機(jī)器學(xué)習(xí)、分布式機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)理論等機(jī)器學(xué)習(xí)的各個(gè)分支取得了多項(xiàng)重要研究成果,為機(jī)器學(xué)習(xí)的加速發(fā)展奠定了有力的理論基礎(chǔ)。 2008年8月5號(hào)——北京奧運(yùn)會(huì)開(kāi)始的前三天,陳薇因?yàn)樗谥锌圃旱膶?dǎo)師與微軟亞洲研究院的聯(lián)合科研項(xiàng)目,開(kāi)始了在微軟亞洲研究院的實(shí)習(xí)。當(dāng)時(shí)陳薇主要做的是與復(fù)雜隨機(jī)網(wǎng)絡(luò)相關(guān)的課題,并為此提供一些算法的理論分析。2010年陳薇的實(shí)習(xí)結(jié)束,優(yōu)異的她獲得了微軟亞洲研究院的Offer,但讓她有些猶豫的是,像她一樣學(xué)數(shù)學(xué)的同學(xué)在當(dāng)時(shí)大多都選擇去了高?;蚪鹑跈C(jī)構(gòu),跨界到計(jì)算機(jī)領(lǐng)域可算是同學(xué)中的獨(dú)一份。 在這個(gè)抉擇的過(guò)程中,陳薇當(dāng)時(shí)的Mentor、現(xiàn)任微軟亞洲研究院副院長(zhǎng)劉鐵巖博士給出了幾條建議,令她記憶猶新:一,無(wú)論在什么組織里,最重要的都是體現(xiàn)自己的價(jià)值,不要因?yàn)轶w制不同、有陌生感,就擔(dān)心、害怕,在哪里都是做研究,與體制無(wú)關(guān);二,對(duì)于行業(yè)問(wèn)題,在高校做研究一般按照自己的知識(shí)體系前行,基于自己技術(shù)積累的程度,去尋找相應(yīng)的研究問(wèn)題,但在微軟亞洲研究院,你會(huì)發(fā)現(xiàn)因?yàn)榛谖④涍@個(gè)平臺(tái)公司,這里永遠(yuǎn)不缺少計(jì)算機(jī)科學(xué)問(wèn)題,而且這里還有大量的數(shù)據(jù),所以數(shù)學(xué)在這里也有很大的發(fā)揮空間——可以把問(wèn)題抽象出來(lái),然后利用數(shù)據(jù)再把它的Pattern(模型)找出來(lái);三,與聰明人為伴,或者說(shuō)是與能夠讓你進(jìn)步的人一起工作。 微軟亞洲研究院主管研究員陳薇 彼時(shí),在微軟亞洲研究院實(shí)習(xí)了兩年多的陳薇已經(jīng)對(duì)微軟亞洲研究院相當(dāng)了解,并且學(xué)到了不少技術(shù)和方法論?!皵?shù)學(xué)的本質(zhì)就是一個(gè)把問(wèn)題抽象出來(lái),利用數(shù)據(jù)和數(shù)學(xué)邏輯進(jìn)行推理建模尋找規(guī)律的過(guò)程。微軟亞洲研究院作為一個(gè)頂級(jí)的研究機(jī)構(gòu),所面臨的問(wèn)題也是來(lái)自前沿的挑戰(zhàn),在這里你完全就是站在計(jì)算機(jī)科學(xué)研究的最頂端。”因此陳薇決定加入微軟亞洲研究院便無(wú)懸念?,F(xiàn)在回想起來(lái),陳薇覺(jué)得自己可能一直就有那么一股愿意解決各種問(wèn)題的沖勁兒,而這股力量后來(lái)又推動(dòng)她攻克下了一個(gè)又一個(gè)難題。 陳薇面臨的第一個(gè)難題就是排序項(xiàng)目,當(dāng)時(shí)業(yè)界已經(jīng)有了很多排序算法,同時(shí)也有很多排序的評(píng)價(jià)準(zhǔn)則。但陳薇和同事們卻發(fā)現(xiàn),那會(huì)兒訓(xùn)練模型的算法是一套,而評(píng)價(jià)準(zhǔn)則卻是另外一套,于是他們?cè)噲D打通其中的關(guān)聯(lián),從而完善整個(gè)體系。在研究的過(guò)程中,擁有數(shù)學(xué)背景的陳薇不僅設(shè)計(jì)了全新的本質(zhì)損失函數(shù),找到了更好的算法,而且對(duì)于走在前面的算法,她還給出了理論上的解釋?zhuān)グl(fā)現(xiàn)還有什么可以改進(jìn)的空間。就這樣,訓(xùn)練模型和評(píng)價(jià)準(zhǔn)則之間的關(guān)系便有解了。陳薇也第一次在計(jì)算機(jī)領(lǐng)域的研究中,深刻地體會(huì)到了數(shù)學(xué)的用武之地。 排序算法中的本質(zhì)損失函數(shù) 相反,對(duì)算法問(wèn)題進(jìn)行數(shù)學(xué)拆分,再逐步研究其中的優(yōu)化空間,則是陳薇利用數(shù)學(xué)思維開(kāi)辟出的蹊徑,同時(shí),這也是陳薇做分布式機(jī)器學(xué)習(xí)的思路。事實(shí)上,分布式機(jī)器學(xué)習(xí)與傳統(tǒng)分布式計(jì)算有本質(zhì)區(qū)別,因?yàn)樗且粋€(gè)迭代式的優(yōu)化算法。用分布式計(jì)算去做機(jī)器學(xué)習(xí),就要把問(wèn)題一步步細(xì)化,比如數(shù)據(jù)怎么分、本地間如何交互、如何合并成模型、什么時(shí)候通信、如何通信等等,當(dāng)把整個(gè)分布式框架拆分開(kāi)來(lái),優(yōu)化的路徑也更為清晰。在陳薇看來(lái),這正是數(shù)學(xué)的體系化思維帶給她的優(yōu)勢(shì)。 關(guān)于數(shù)學(xué)思維,陳薇認(rèn)為它是一整套的體系化思考和觀(guān)察角度,與之相應(yīng)的方法論,就是她的導(dǎo)師中科院數(shù)學(xué)院馬志明院士常教導(dǎo)的——做應(yīng)用數(shù)學(xué)的學(xué)生們要“頂天立地”。馬老師常說(shuō):“做算法做到最后需要去理解它背后的數(shù)學(xué)機(jī)理是什么?它的理論保證是什么?除了實(shí)驗(yàn)上的嘗試之外,我們還要證明一些東西,去改進(jìn)它。這樣就有機(jī)會(huì)產(chǎn)生顛覆性創(chuàng)新思維,做到勝人一籌,這叫做‘頂天’。與此同時(shí),在實(shí)驗(yàn)過(guò)程中,不斷發(fā)現(xiàn)問(wèn)題、優(yōu)化問(wèn)題、解決問(wèn)題,使得算法能真正解決實(shí)際問(wèn)題,這就是‘立地’?!薄绊斕炝⒌亍彼膫€(gè)字陪伴著陳薇在微軟亞洲研究院走過(guò)了10年,也讓她在之后的諸多跨界研究中有了底氣。 陳薇的數(shù)學(xué)專(zhuān)業(yè)方向是概率統(tǒng)計(jì),偏向于連續(xù)數(shù)學(xué)。但在她正式加入微軟亞洲研究院之后不久,她所在的小組調(diào)整了研究方向——研究屬于博弈論范疇的廣告拍賣(mài)機(jī)制。博弈論具有離散組合數(shù)學(xué)的屬性,與連續(xù)的概率統(tǒng)計(jì)技術(shù)相差很大。幾乎陌生的研究領(lǐng)域起初讓陳薇有些畏難情緒,因?yàn)檫@意味著她要從頭學(xué)習(xí)博弈論的所有理論基礎(chǔ)。但作為當(dāng)時(shí)組里唯一一位數(shù)學(xué)專(zhuān)業(yè)出身的研究員,陳薇開(kāi)始組織大家閱讀、學(xué)習(xí)相關(guān)文獻(xiàn)著作,漸漸投身研究。 傳統(tǒng)的廣告詞購(gòu)買(mǎi),數(shù)據(jù)匹配通常不夠精確、靈活,遇到關(guān)鍵詞有多種意思時(shí)很容易混淆,比如蘋(píng)果,可能是指水果,也可能是指電子產(chǎn)品,但無(wú)論廣告主投標(biāo)的是這一關(guān)鍵詞的何種含義,其廣告都會(huì)被混在一起打包投放。這種拍賣(mài)機(jī)制中并不存在納什均衡,系統(tǒng)的穩(wěn)定性較差,博弈論關(guān)心的兩個(gè)目標(biāo)社會(huì)福利和平臺(tái)收益也無(wú)從保證。為了解決這個(gè)問(wèn)題,陳薇及其合作者設(shè)計(jì)了全新的概率廣義匹配拍賣(mài)機(jī)制,根據(jù)數(shù)據(jù)設(shè)計(jì)概率將關(guān)鍵詞匹配至更細(xì)致的含義中,使得系統(tǒng)存在性質(zhì)優(yōu)良的納什均衡。經(jīng)過(guò)兩年的時(shí)間,這一研究成果最終被計(jì)算機(jī)經(jīng)濟(jì)學(xué)領(lǐng)域最權(quán)威的學(xué)術(shù)會(huì)議ACM EC接收。 概率廣義匹配拍賣(mài)機(jī)制 同時(shí),陳薇也在思考如何用機(jī)器學(xué)習(xí)算法設(shè)計(jì)機(jī)制。不同于傳統(tǒng)的監(jiān)督學(xué)習(xí),博弈問(wèn)題中的行為數(shù)據(jù)會(huì)隨著策略的變化而變化,學(xué)習(xí)算法所需要必備的泛化性能受到挑戰(zhàn)。陳薇及其合作者引入行為學(xué)習(xí)模塊,用來(lái)模擬行為數(shù)據(jù)的變化,然后設(shè)計(jì)機(jī)制學(xué)習(xí)模塊學(xué)習(xí)最優(yōu)機(jī)制。他們證明了如果行為模型是馬氏的,學(xué)習(xí)算法仍然具有良好的泛化性能。他們稱(chēng)這一針對(duì)博弈論問(wèn)題具有良好泛化性能的算法“博弈機(jī)器學(xué)習(xí)”。
博弈機(jī)器學(xué)習(xí) 陳薇表示,博弈機(jī)器學(xué)習(xí)這個(gè)項(xiàng)目完成之后,涉及任何數(shù)學(xué)分支的研究她都敢去接觸,無(wú)論自己之前在某個(gè)或某些領(lǐng)域的積累有多少,但如果遇到新的問(wèn)題,需要去“啃”新的技術(shù)和理論,那也沒(méi)有什么可怕的。在她看來(lái),這樣的學(xué)習(xí)能力,也是做一個(gè)研究員所必須具備的基本素質(zhì)。 2014年左右,陳薇在劉鐵巖博士的鼓勵(lì)下開(kāi)始研究深度學(xué)習(xí)理論。深度學(xué)習(xí)理論研究是知名的硬骨頭,當(dāng)時(shí)業(yè)界有一個(gè)說(shuō)法就是“深度學(xué)習(xí)沒(méi)有理論”。所謂“沒(méi)有理論”,是因?yàn)檫^(guò)去從來(lái)沒(méi)有人提出相應(yīng)的理論,業(yè)內(nèi)整體對(duì)此也很迷茫。幾十年前就已經(jīng)被提出的神經(jīng)網(wǎng)絡(luò)概念,在近十年再度覺(jué)醒,一下成為了風(fēng)靡業(yè)界的寵兒,整個(gè)學(xué)術(shù)圈都在追求設(shè)計(jì)出更大、更好的深度學(xué)習(xí)模型,但始終忽略了對(duì)其背后理論的探索。 這個(gè)工作非常重要且意義非凡,因此劉鐵巖博士極力勸說(shuō)陳薇去嘗試探究。但因?yàn)榇饲皼](méi)有人做過(guò)對(duì)深度學(xué)習(xí)理論的研究,所以其難度可想而知,沒(méi)有任何可參考的資料和思路,一切完全都要自己去理解和創(chuàng)造。 陳薇坦言,每次遇到嶄新的考驗(yàn),她都會(huì)懷疑自己的堅(jiān)韌,而每當(dāng)這種時(shí)候,劉鐵巖博士總能幫她將顧慮一條條厘清,克服障礙。“這或許就是Mentor的含義,微軟亞洲研究院就是這樣靠著Mentor,靠著一群志同道合的聰明人,一代一代傳承下去”陳薇說(shuō)。 于是,劉鐵巖博士又給陳薇提出了三個(gè)建議:一,要從更高層次的角度去思考問(wèn)題,這是學(xué)數(shù)學(xué)的同學(xué)需要特別注意的地方,因?yàn)閿?shù)學(xué)證明很容易陷入到細(xì)節(jié)里去,這種時(shí)候需要能夠跳出來(lái)看問(wèn)題,從更高的層面去把握小問(wèn)題之間的關(guān)聯(lián);同時(shí)學(xué)習(xí)傾聽(tīng)你的直覺(jué),在舉棋不定的時(shí)候,可能直覺(jué)會(huì)告訴你應(yīng)該朝哪個(gè)方向走,而這對(duì)數(shù)學(xué)證明也會(huì)有幫助。二,要樹(shù)立一個(gè)特別特別高的目標(biāo),不要覺(jué)得這是個(gè)開(kāi)放問(wèn)題就放任不理,去做你覺(jué)得應(yīng)該做的,去做真正有影響力的事情,哪怕它很難。三,不斷學(xué)習(xí),需要用到什么就學(xué)什么,要有針對(duì)性地學(xué)。 2016年,陳薇及其合作者用間隔理論解釋了深度學(xué)習(xí)中網(wǎng)絡(luò)層數(shù)的作用。近兩年,學(xué)術(shù)界和業(yè)界開(kāi)始普遍關(guān)注深度學(xué)習(xí)的理論問(wèn)題,而她和團(tuán)隊(duì)已經(jīng)進(jìn)一步向前,從更加大膽的視角去剖析深度學(xué)習(xí)理論。
陳薇(左二)、劉鐵巖(左三)與團(tuán)隊(duì)成員 “影響力”這個(gè)詞讓陳薇找到了她的目標(biāo)所在。在工作中,尤其是做研究,影響力是最核心的評(píng)價(jià)指標(biāo),雖然在微軟亞洲研究院并沒(méi)有具體的KPI,但每位研究員都在致力于做出具有影響力的研究和項(xiàng)目。而在生活中,陳薇也借鑒了“影響力”這個(gè)概念。 正如文章開(kāi)頭所說(shuō),陳薇覺(jué)得人生也可以用數(shù)學(xué)邏輯去優(yōu)化,她發(fā)現(xiàn)人們?cè)趯で笞顑?yōu)值的過(guò)程中有時(shí)會(huì)走彎路,常常把數(shù)學(xué)模型中的約束(Constraint)錯(cuò)當(dāng)成了目標(biāo),這里的約束,有時(shí)候是婚姻,有時(shí)候是子女,有時(shí)候是“剩者為王”的社會(huì)壓力?!拔覀円?jiàn)過(guò)太多的啟程,因?yàn)槟撤N‘和解’半途而廢,而這時(shí)調(diào)轉(zhuǎn)馬頭所朝的方向,早已不是出發(fā)時(shí)的目標(biāo)?!彼?strong>當(dāng)你急著趕路,要去向某個(gè)終點(diǎn)的時(shí)候,不妨?xí)r常靜下心來(lái)想一想,那是“約束”還是真正的“目標(biāo)”? 你也許還想看: ● 科學(xué)匠人 | 打開(kāi)AI黑匣子,“三清”學(xué)子的科學(xué)故事 ● 科學(xué)匠人 | 做研究像潛水,要習(xí)慣海水的起伏 ● 科學(xué)匠人 | 攜手微軟亞洲研究院12年,只若初見(jiàn)
|
|
來(lái)自: horsedoc > 《待分類(lèi)》