自 1956 年“人工智能”概念首次被提出,70 多年時光澆筑和歲月雕刻,以至今天“AI 無處不在”的繁榮景象。其中離不開的,更是一代代科研工作者的博積耕耘。 今年 1 月,AMiner 團隊推出 AI 2000 榜單,旨在通過 AMiner 學術(shù)數(shù)據(jù)在全球范圍內(nèi)遴選過去十年間,人工智能學科最有影響力、最具活力的頂級學者,贊揚他們對于人工智能研究領(lǐng)域的卓越貢獻。本次學術(shù)頭條有幸對入圍這一名單的北京郵電大學計算機學院副教授王嘯進行了采訪。 從事科學研究,離不開長久的堅持和持續(xù)的努力,但對王嘯來說,付出的價值,取決于對目標的追求。他說:“在過去的科研經(jīng)歷中,我常常'吾日三省吾身’,希望不斷深入,探究本質(zhì)。”談到進入科研領(lǐng)域的契機,王嘯似乎不同于許多人在摸索中前進,他表示:“其實從我進入科研生涯開始,就一直關(guān)注圖(graph)這個領(lǐng)域?!?/span>王嘯博士就讀于天津大學,2016 年畢業(yè)后進入清華大學擔任研究員,再進入北京郵電大學成為教師。跟許多科研工作者一樣,他認為自己真正開始投身科研,其實是從博士開始的。當時,他的主攻內(nèi)容是社區(qū)發(fā)現(xiàn)(community detection),這是一種用來發(fā)現(xiàn)網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)的問題。當時學者們已經(jīng)發(fā)現(xiàn),社區(qū)與社區(qū)之間存在重疊現(xiàn)象,同時有一些異常點不會被包含在任一社區(qū)中,此外在每個社區(qū)內(nèi)部,都可能存在比其他節(jié)點更關(guān)鍵的“中心節(jié)點”。然而,還沒有一種模型能夠同時較好地識別出上述三種結(jié)構(gòu)。因此,王嘯首先關(guān)注到的問題就是,如何從一個龐大的 graph 中一勞永逸地找到這種社區(qū)所共有的結(jié)構(gòu)。在導師操曉春老師和金弟老師的帶領(lǐng)下,王嘯將重疊社區(qū)、中心點和異常點的識別定義為基于非負矩陣分解(NMF)的優(yōu)化問題,從而得到模型 CDNMF,該模型能夠一次性識別出上述三種社區(qū)特征,具有優(yōu)越的性能。因此,憑借刻苦的鉆研,王嘯從“不知道怎么做出高水平的研究”的科研小白不斷成長,順利發(fā)表了自己學術(shù)生涯開端的第一篇論文,開啟了與“圖”的不解之緣。圖 | CDNMF 模型用于識別社區(qū)特殊結(jié)構(gòu)的結(jié)果:不同形狀代表社區(qū)成員身份,不同顏色代表不同社區(qū)。中心點由黑色方框標記;有多種顏色的節(jié)點即重疊處;粉色節(jié)點為異常值。時光荏苒,王嘯始終沉醉于圖的魅力之中。2016 年博士畢業(yè)后,他進入清華大學開始研究圖表示學習,即如何學習圖數(shù)據(jù)在低維空間中的向量表示。這期間,最讓他印象深刻的是 2017 年完成的一項成果:當時,主要的網(wǎng)絡(luò)嵌入方法通常選擇保留社區(qū)微觀結(jié)構(gòu),例如節(jié)點的一階和二階近鄰。但王嘯發(fā)現(xiàn),保留網(wǎng)絡(luò)最顯著特征之一的中觀社區(qū)結(jié)構(gòu)對于提升表示學習性能也非常重要,于是,他們提出了一種新的模塊化非負矩陣分解(M-NMF)模型,將社區(qū)結(jié)構(gòu)納入到網(wǎng)絡(luò)嵌入(network embedding)的低維表示方法中,使節(jié)點的表示學習既能保持微觀結(jié)構(gòu),又能保持社區(qū)結(jié)構(gòu)。圖 | M-NMF 模型在華盛頓大學網(wǎng)絡(luò)社區(qū)中的性能表現(xiàn)(最低約 43%),優(yōu)于當時其他模型近幾年,王嘯則重點關(guān)注圖神經(jīng)網(wǎng)絡(luò)(GNN)的研究,2019 年,他發(fā)表了“HeterogeneousGraph Attention Network”一文,那時人們已經(jīng)關(guān)注到了圖神經(jīng)網(wǎng)絡(luò),它能夠?qū)⑸疃葘W習應(yīng)用到圖數(shù)據(jù)結(jié)構(gòu)中,但主要還是集中在同質(zhì)圖。但對于包含不同類型節(jié)點和邊的異質(zhì)圖,其異質(zhì)性和豐富的語義信息給異質(zhì)圖神經(jīng)網(wǎng)絡(luò)的設(shè)計帶來巨大的挑戰(zhàn)。因此,王嘯團隊瞄準這一問題,提出了基于層次注意力機制的異質(zhì)圖神經(jīng)網(wǎng)絡(luò) HAN,同時學習節(jié)點級注意力和語義級注意力,這幾乎是第一項成功構(gòu)建異質(zhì)圖神經(jīng)網(wǎng)絡(luò)的研究。直到今天,該論文還是他成果中引用量最高的一篇。圖 | HAN 總體框架。(a)所有類型的節(jié)點都被投影到一個統(tǒng)一的特征空間中,基于元路徑的節(jié)點權(quán)重可以通過節(jié)點級注意來學習。(b) 聯(lián)合學習每個元路徑的權(quán)重,并通過語義注意融合語義特定節(jié)點嵌入。(c) 計算擬建 HAN 的損耗和端到端優(yōu)化。這項工作對于王嘯來說,意義自然非凡:“后來的許多圖神經(jīng)網(wǎng)絡(luò)研究者都關(guān)注到了它,這也是我自己比較喜歡的一個工作。總體來講,基本上我的整個學術(shù)研究生涯都是圍繞著圖展開的?!?/span>成功之路,往往布滿荊棘,踏上這條路時,有人苦于腳下的刺痛,也有人樂在其中。對王嘯來說,科研旅途上的困難自不必說,但他更想銘記幸運之神的眷顧。讀博時剛開始做科研,王嘯也有過迷茫,但更多地是慶幸:“我遇到這樣一位手把手指導自己的老師——從討論論文開始,到產(chǎn)生自己的想法再到實現(xiàn)最后的模型,包括每個實驗的推進,操曉春老師和金弟老師都給予了我非常細致的指導。”在天大求學的時候,每天晚上金弟老師都會叫他一起跑步,跑步過程中都會多多少少聊上一些學術(shù)問題,那個時候他剛開始研究生涯,但這些緊密的交流從一開始就避免了他的很多彎路。每周與操老師高強度的組會,更是從一開始就打開了許多的思路。后來在完成 M-NMF 模型這項成果的過程中,他坦言,這項工作是在清華楊士強老師團隊開展的,剛開始加入到團隊時,自己有很多的想法,與崔鵬老師和朱文武老師在組會時都有不斷的討論,但遺憾的是會被否決掉很多的想法。那時候也逐漸更加深刻地體會到自己很多的想法的確不夠本質(zhì),而應(yīng)該做最頂級的研究,解決最本質(zhì)的問題。記憶很深刻的是當時組會上和一群師兄弟們討論 M-NMF 這個想法,有種被“圍攻”的感覺,一場討論下來,出了一身汗筋疲力盡,工作還沒有做出來就仿佛已經(jīng)被眾多評審人給評審?fù)噶恕5?jīng)過了團隊不斷地產(chǎn)出觀點-否定-再產(chǎn)出的磨人過程,雖然時間戰(zhàn)線也拉得很長,但幸運地是,“我們沒有產(chǎn)生放棄或動搖的念頭,千錘百煉之后讓我對工作也認識地更加深刻,自己內(nèi)心要有信仰,到底什么是本質(zhì)的問題,而本質(zhì)的問題才是非常重要和值得深入探索的?!盡-NMF 最終投稿一次就被順利接收,而且很榮幸地得到了不少同行們的關(guān)注。而身處日新月異的計算機研究領(lǐng)域之中,快節(jié)奏和激烈的競爭也無法避免,尤其是圖表示學習這一塊,近些年的關(guān)注度非常大。2019 年,王嘯團隊有關(guān)異質(zhì)圖的研究也經(jīng)歷了“冒險時刻”——“我們當時正在開展異質(zhì)圖神經(jīng)網(wǎng)絡(luò) HAN 的研究,實際上當時同期也的確有很多同行們在研究這類新工作,幸運的是我們這項工作最后被順利接收并發(fā)表出來。其實我們也有不少沒有被順利接收的與同行們同期做的工作,曾經(jīng)有個工作我們開展的很早,但最后看到斯坦福大學的一個大牛組比我們先發(fā)表了相關(guān)的工作。雖有遺憾,但還是很榮幸看到我們研究的問題也正是優(yōu)秀同行們在關(guān)注的問題,我們做的事情正在對標國際同行們的水準,我們應(yīng)該是做了對的事情,做了好的工作。這也無形中讓我們覺得有能力也有機會可以與國際頂級同行們扳手腕。”值得一提的是,讀博期間,王嘯曾在圣路易斯華盛頓大學訪學一年,回憶起這段經(jīng)歷,他表示,雖然經(jīng)歷了語言、環(huán)境等方面的小小不適應(yīng),但更陶醉于自由的科研氛圍,遇到了許多優(yōu)秀的同伴,也很幸運地得到了章偉雄老師的指導,他還清晰記得當時章老師在給他逐字逐句修改論文的時候,他在電腦旁邊等待著隨時和章老師討論的情景,現(xiàn)在回頭看當時寫的論文,章老師應(yīng)該是給予了很大的耐心了。求學、做研究、當老師,一路的多重轉(zhuǎn)變中,王嘯遇到了許多人的提點和幫助,從入門科研,到科研想法的各種討論磨合,到最后論文一點一滴的修改。也正是深深受到恩師們、同行們的影響,所以在自己也成為一名老師后,他也希望能夠在指導學生時“一點點的耐心去引導、糾正,盡自己所能,讓他們盡量地少走一些彎路。”面對年輕學生們?nèi)绾芜M入科研工作的問題,王嘯總結(jié)了科研必備“三件套”:第一件“裝備”就是學生應(yīng)該重視和老師的緊密合作。正如他的親身經(jīng)歷那樣,老師的幫助和指導往往能夠讓年輕人們避開一些坑。許多年輕人剛開始都有很強的能力和追求,但由于缺乏經(jīng)驗,在遇到過多挫折和困難之后,都會對科研選擇產(chǎn)生很大動搖。因此,王嘯也常常告訴自己的學生要積極主動地找老師溝通:“無論是學習科研方面,還是生活中的任何問題和想法,其實都可以跟老師講,不要怕老師,因為作為老師,我們非常希望能夠幫助到學生,這在另一方面也是我們的收獲。”所以這其實是老師身上所肩負的責任。第二件“裝備”就是要有意識地培養(yǎng)學生的批判精神。一方面,年輕人要具備獨立的判斷和思考能力。但王嘯更關(guān)注的是,怎樣才能培養(yǎng)這種批判精神呢?因此他堅信老師應(yīng)該發(fā)揮“領(lǐng)頭羊”的作用。“師者,傳道授業(yè)解惑也”——在平時的指導中,王嘯常常和學生一起討論“為什么?”,組會的時候甚至討論到有些“杠精”。學生們可能會有些不理解,但是他認為通過不斷提問方式,要讓學生逐漸潛移默化地養(yǎng)成主動思考的方式。第三件“裝備”就是要有內(nèi)心的信仰與堅持??蒲械倪^程是坎坷的,是未知的。沒有人的科研會一直是一帆風順的。如果做好的科研,正如之前的吾日三省吾身,要時常問問自己,到底什么是本質(zhì)問題,到底自己是不是在解決一個本質(zhì)問題,自己是不是堅持在一個正確的道路之上。好的科研問題不分熱門冷門,其實在于自己內(nèi)心能不能真正說服自己是有價值的。正如他信仰著圖這一形式對數(shù)據(jù)的大一統(tǒng),對關(guān)系的刻畫在任何建模中都有著極大的價值。即便遇到了困難,但是只要堅持,總會有希望。最后,王嘯也鼓勵學生們“趁年輕,多多學習”。無論是繼續(xù)深造還是工作實踐,都離不開長久堅持的學習和自我提高,在負擔較輕、環(huán)境較為單純的情況下,心無旁騖地學習實際上是一種難得的機會,因此,他說:“抓住這樣的好時候,一定能攀上想要達到的山峰?!?/span>王嘯,北京郵電大學計算機學院副教授,碩士生導師,鵬城實驗室兼聘助理研究員。研究方向為圖神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)挖掘與機器學習。清華大學博士后,天津大學博士,美國圣路易斯華盛頓大學聯(lián)合培養(yǎng)博士,獲得 ACM China 新星提名獎,入選微軟亞洲研究院鑄星學者,CCF 高級會員。共發(fā)表論文 70 余篇,總引用 4500 余次,其中 CCFA 類論文 40 余篇,ESI 高被引論文1篇,3篇論文單篇引用超過 700 次,1 篇提名 WWW 2021 最佳論文, 1 篇獲得 ICDM 2021 最佳學生論文亞軍,5 篇論文入選最有影響力論文榜單,成果被多次寫入圖深度學習標準庫,如 PyTorch Geometric 和 DGL。出版教材一部,英文專著一部,著作章節(jié)一章。擔任 WWW/AAAI/IJCAI 的高級程序委員會委員。主持多項國家自然科學基金和 CCF-騰訊犀牛鳥科研基金。https://www./profile/xiao-wang/56063c4045cedb3396804359https://scs./info/1090/1758.htmAI 2000 榜單由清華大學 AMiner 聯(lián)合北京智源研究院、清華-中國工程院知識智能聯(lián)合研究中心共同發(fā)布,旨在通過 AMiner 學術(shù)數(shù)據(jù)在全球范圍內(nèi)遴選過去十年人工智能學科最有影響力、最具活力的頂級學者。榜單評選基于 2011-2020 十年間人工智能領(lǐng)域 49 家頂級期刊會議收錄的共計 178,254 篇論文、204483 位作者的大數(shù)據(jù),采用智能算法自動化生成榜單,得到 200 位“AI 2000 最具影響力學者獎”以及 1800 位“AI 2000 最具影響力學者提名獎”。
|