|
一款新型芯片在求解128×128矩陣問(wèn)題時(shí),計(jì)算吞吐量達(dá)頂級(jí)GPU的1000倍,將傳統(tǒng)GPU一天的任務(wù)壓縮至一分鐘完成——這并非科幻場(chǎng)景,而是北京大學(xué)團(tuán)隊(duì)剛剛發(fā)布的科研成果。當(dāng)全球科技巨頭在數(shù)字計(jì)算賽道上瘋狂“內(nèi)卷”,中國(guó)研究人員卻選擇了一條與眾不同的路徑。 近日,北京大學(xué)人工智能研究院孫仲研究員團(tuán)隊(duì)聯(lián)合集成電路學(xué)院,成功研制出基于阻變存儲(chǔ)器的高精度、可擴(kuò)展模擬矩陣計(jì)算芯片。這項(xiàng)發(fā)表于10月13日《自然·電子學(xué)》的成果,首次實(shí)現(xiàn)了在精度上可與數(shù)字計(jì)算媲美的模擬計(jì)算系統(tǒng)。模擬計(jì)算這項(xiàng)沉寂半個(gè)世紀(jì)的技術(shù),正以顛覆性姿態(tài)重返計(jì)算舞臺(tái)中央。 ![]() 01 突破瓶頸:模擬計(jì)算重返舞臺(tái)在計(jì)算機(jī)發(fā)展早期,模擬計(jì)算曾一度占據(jù)主導(dǎo)地位,但隨著計(jì)算任務(wù)日益復(fù)雜,其精度瓶頸凸顯,逐漸被數(shù)字計(jì)算取代。孫仲研究員指出,此次研究的核心正是要解決模擬計(jì)算 “算不準(zhǔn)” 這一痛點(diǎn)。 數(shù)字計(jì)算像用摩斯密碼發(fā)電報(bào),每個(gè)數(shù)字都要翻譯成“0和1”的密碼本;而模擬計(jì)算直接對(duì)著話筒喊話,電壓高低就是數(shù)字大小。這種直接使用連續(xù)物理量進(jìn)行計(jì)算的方式,取消了二進(jìn)制轉(zhuǎn)換環(huán)節(jié),開啟了數(shù)據(jù)處理的“直達(dá)通道”。 ![]() 02 技術(shù)原理:阻變存儲(chǔ)器的妙用北大團(tuán)隊(duì)選擇了一條融合創(chuàng)新的道路,通過(guò)新型信息器件、原創(chuàng)電路和經(jīng)典算法的協(xié)同設(shè)計(jì),構(gòu)建了基于阻變存儲(chǔ)器陣列的高精度、可拓展的全模擬矩陣方程求解器。 核心突破在于三個(gè)方面: 團(tuán)隊(duì)首次將模擬計(jì)算的精度提升至24位定點(diǎn)精度。在實(shí)驗(yàn)上成功實(shí)現(xiàn)16×16矩陣的24比特定點(diǎn)數(shù)精度求逆,矩陣方程求解經(jīng)過(guò)10次迭代后,相對(duì)誤差可低至10??量級(jí)。與國(guó)內(nèi)外許多團(tuán)隊(duì)集中于研究矩陣乘法不同,孫仲團(tuán)隊(duì)專注于更具挑戰(zhàn)性的矩陣方程求解——這正是AI二階訓(xùn)練的核心。矩陣求逆操作要求的計(jì)算精度極高,時(shí)間復(fù)雜度達(dá)到了立方級(jí)。 03 性能表現(xiàn):千倍提升的現(xiàn)實(shí)意義性能數(shù)據(jù)令人矚目:在求解32×32矩陣求逆問(wèn)題時(shí),其算力已超越高端GPU的單核性能。當(dāng)問(wèn)題規(guī)模擴(kuò)大至128×128時(shí),計(jì)算吞吐量達(dá)到頂級(jí)數(shù)字處理器的1000倍以上。能效提升同樣顯著,在相同精度下能效比傳統(tǒng)數(shù)字處理器提升超100倍。這意味著,傳統(tǒng)GPU干一天的活,這款芯片一分鐘就能搞定。研究團(tuán)隊(duì)將該技術(shù)應(yīng)用于“大規(guī)模MIMO信號(hào)檢測(cè)”中,僅用3次迭代,恢復(fù)的圖像就和原始圖像高度一致,誤碼率和32位數(shù)字計(jì)算效果相當(dāng)。 04 架構(gòu)革新:“存算一體”破局之道當(dāng)前主流的CPU和GPU都采用馮諾依曼結(jié)構(gòu),將計(jì)算和存儲(chǔ)功能分開,通過(guò)01數(shù)字流的編譯+計(jì)算+解碼實(shí)現(xiàn)信息計(jì)算和傳輸。這種結(jié)構(gòu)導(dǎo)致計(jì)算過(guò)程中數(shù)據(jù)需要頻繁地在存儲(chǔ)器和處理器之間搬運(yùn),形成所謂的 “存儲(chǔ)墻”瓶頸。 基于阻變存儲(chǔ)器的模擬計(jì)算的優(yōu)勢(shì)在于取消了“將數(shù)據(jù)轉(zhuǎn)化為二進(jìn)制數(shù)字流”這一過(guò)程,同時(shí)不必進(jìn)行“過(guò)程性數(shù)據(jù)存儲(chǔ)”,進(jìn)而將數(shù)據(jù)計(jì)算過(guò)程與數(shù)據(jù)存儲(chǔ)合而為一,實(shí)現(xiàn)算力解放。這種 “存算一體”設(shè)計(jì)直擊AI算力瓶頸,突破了傳統(tǒng)馮諾依曼架構(gòu)的限制。 05 應(yīng)用前景:AI與6G的算力利器關(guān)于應(yīng)用前景,孫仲認(rèn)為,模擬計(jì)算在未來(lái)AI領(lǐng)域的定位是強(qiáng)大的補(bǔ)充,最有可能快速落地的場(chǎng)景是計(jì)算智能領(lǐng)域,如機(jī)器人和人工智能模型的訓(xùn)練。這項(xiàng)技術(shù)為應(yīng)對(duì)人工智能與6G通信等領(lǐng)域的算力挑戰(zhàn)開辟了全新路徑。大規(guī)模MIMO信號(hào)檢測(cè)是6G通信的關(guān)鍵科學(xué)問(wèn)題之一,而北大團(tuán)隊(duì)的芯片在這一領(lǐng)域已顯示出巨大潛力。 ![]() 談及與現(xiàn)有計(jì)算架構(gòu)的關(guān)系,孫仲?gòu)?qiáng)調(diào)未來(lái)將是互補(bǔ)共存:“CPU作為通用'總指揮’因其成熟與經(jīng)濟(jì)性而難以被淘汰。GPU則專注于加速矩陣乘法計(jì)算。我們的模擬計(jì)算芯片,旨在更高效地處理AI等領(lǐng)域最耗能的矩陣逆運(yùn)算,是對(duì)現(xiàn)有算力體系的有力補(bǔ)充?!?/span> 06 產(chǎn)業(yè)落地:從實(shí)驗(yàn)室到市場(chǎng)燕芯微作為北大集成電路學(xué)院團(tuán)隊(duì)原始創(chuàng)新成果轉(zhuǎn)化的重要載體,正全力推進(jìn)國(guó)產(chǎn)新型先進(jìn)ReRAM芯片及智能應(yīng)用產(chǎn)品的研發(fā)與產(chǎn)業(yè)落地。團(tuán)隊(duì)采用的ReRAM技術(shù)為多年前已實(shí)現(xiàn)Lab to Fab成果轉(zhuǎn)化的技術(shù)。 北大集成電路學(xué)院和燕芯微團(tuán)隊(duì)近年來(lái)多次在微電子旗艦會(huì)議IEDM的Memory Technology方向刷新先進(jìn)工藝節(jié)點(diǎn)ReRAM存儲(chǔ)密度紀(jì)錄,實(shí)現(xiàn)了同節(jié)點(diǎn)存儲(chǔ)密度相比同期同類技術(shù)提高30%-40%。這項(xiàng)基于高性能高可靠阻變存儲(chǔ)器芯片的工作已經(jīng)引起產(chǎn)業(yè)界的廣泛關(guān)注。 ![]() 07 未來(lái)展望:模擬計(jì)算的復(fù)興之路從長(zhǎng)遠(yuǎn)來(lái)看,如果模擬計(jì)算突破精度封印,或?qū)⒁l(fā) “后馮諾依曼時(shí)代” 的算力革命。自然界本質(zhì)是模擬的——人腦不會(huì)用二進(jìn)制思考。孫仲表示,團(tuán)隊(duì)正在積極推進(jìn)產(chǎn)業(yè)落地,但實(shí)現(xiàn)產(chǎn)業(yè)化還需要多方的協(xié)調(diào)與努力。當(dāng)前在很多代工廠有突破,但是更多依然是將阻變存儲(chǔ)器用于存儲(chǔ)器本身。 不只將它用于存儲(chǔ),也用于計(jì)算,是對(duì)其應(yīng)用能力的一種拓展,這要求更有針對(duì)性的生產(chǎn)工藝探索。 ![]() 模擬計(jì)算芯片不會(huì)完全取代數(shù)字芯片,但它在特定任務(wù)上的驚人表現(xiàn),已經(jīng)為算力發(fā)展提供了全新路徑。當(dāng)數(shù)字芯片制程微縮逐漸逼近物理極限,曾被遺忘的模擬計(jì)算以全新姿態(tài)回歸,與數(shù)字計(jì)算互補(bǔ)共存,共同支撐起未來(lái)智能世界的算力基礎(chǔ)。 |
|
|