機(jī)器學(xué)習(xí)技術(shù)在靜息態(tài)功能磁共振成像(rs-fMRI)數(shù)據(jù)分析方面已經(jīng)獲得了突出地位。在這里,作者對(duì)各種非監(jiān)督和有監(jiān)督機(jī)器學(xué)習(xí)在rs-fMRI的應(yīng)用進(jìn)行了總結(jié)。作者在本文中提供了rs-fMRI中機(jī)器學(xué)習(xí)方法的系統(tǒng)分類(lèi)。基于無(wú)監(jiān)督學(xué)習(xí)方法在rs-fMRI中的應(yīng)用,作者根據(jù)它們是否發(fā)現(xiàn)了跨空間、時(shí)間或人群的主要變化模式,確定了三大類(lèi)無(wú)監(jiān)督學(xué)習(xí)方法。下一步,作者回顧了推動(dòng)有監(jiān)督被試水平(subject_level)預(yù)測(cè)成功的算法和有效的rs-fMRI特征表示的方法。其目的是從機(jī)器學(xué)習(xí)應(yīng)用的角度對(duì)rs-fMRI的新興領(lǐng)域進(jìn)行一個(gè)高層次的概述。本文發(fā)表在Magnetic Resonance Imaging雜志。(可添加微信號(hào)siyingyxf或18983979082獲取原文)。靜息態(tài)功能磁共振成像(rs-fMRI)是一種廣泛應(yīng)用的神經(jīng)影像學(xué)工具,它可以在沒(méi)有任何受控實(shí)驗(yàn)范式的情況下,測(cè)量整個(gè)大腦的神經(jīng)血氧水平依賴(lài)性(BOLD)信號(hào)的自發(fā)波動(dòng)。在他們的開(kāi)創(chuàng)性工作中,Biswal等人即使在沒(méi)有明確任務(wù)的情況下,也發(fā)現(xiàn)初級(jí)感覺(jué)運(yùn)動(dòng)皮質(zhì)和遠(yuǎn)距離的其他功能相關(guān)區(qū)域之間的低頻自發(fā)波動(dòng)也存在時(shí)間一致性,這表明靜息狀態(tài)活動(dòng)具有神經(jīng)學(xué)意義。隨后的幾項(xiàng)研究類(lèi)似地報(bào)告了由一項(xiàng)任務(wù)共同激活的其他區(qū)域集合(如語(yǔ)言、運(yùn)動(dòng)、注意力、聽(tīng)覺(jué)或視覺(jué)處理等),這些區(qū)域在靜息狀態(tài)顯示出相關(guān)的同步波動(dòng)。這些自發(fā)的共同波動(dòng)區(qū)域被稱(chēng)為靜息狀態(tài)網(wǎng)絡(luò)(RSN)或內(nèi)在大腦網(wǎng)絡(luò)。此后,RSN一詞指的是使用rs-fMRI發(fā)現(xiàn)的共享功能的大腦網(wǎng)絡(luò)。rs-fMRI有著巨大的潛力來(lái)促進(jìn)作者對(duì)大腦功能組織的理解,以及它是如何因損傷或疾病而改變的。該領(lǐng)域的一個(gè)主要重點(diǎn)是對(duì)靜息狀態(tài)功能連通性(RSFC)的分析,它測(cè)量了大腦空間分布區(qū)域之間的BOLD波動(dòng)的統(tǒng)計(jì)依賴(lài)性。在一些神經(jīng)和精神疾病中發(fā)現(xiàn)了RSFC的紊亂,如阿爾茨海默病,自閉癥,抑郁癥、精神分裂癥等。RSFC的動(dòng)力學(xué)在過(guò)去幾年中也得到了相當(dāng)大的關(guān)注,而rs-fMRI的一個(gè)關(guān)鍵挑戰(zhàn)是開(kāi)發(fā)適當(dāng)?shù)墓ぞ邅?lái)捕捉這種RS活動(dòng)的全部程度。rs-fMRI能捕捉到豐富的內(nèi)在心理狀態(tài)或自發(fā)思維,如果有合適的工具,就有可能產(chǎn)生關(guān)于大腦疾病本質(zhì)的新的神經(jīng)科學(xué)見(jiàn)解。rs-fMRI數(shù)據(jù)的研究具有高度的交叉性,主要受機(jī)器學(xué)習(xí)、信號(hào)處理和圖論等領(lǐng)域的影響。機(jī)器學(xué)習(xí)方法通常以數(shù)據(jù)驅(qū)動(dòng)的方式提供了豐富的rs-fMRI特征。rs-fMRI中的無(wú)監(jiān)督學(xué)習(xí)方法主要集中在了解健康大腦的功能組織及其動(dòng)力學(xué)。例如,矩陣分解或聚類(lèi)等方法可以同時(shí)揭示大腦中的多個(gè)功能網(wǎng)絡(luò),也可以揭示動(dòng)態(tài)功能連接的潛在結(jié)構(gòu)。另一方面,監(jiān)督學(xué)習(xí)技術(shù)可以利用RSFC進(jìn)行個(gè)體水平的預(yù)測(cè)。大量的研究致力于使用rs-fMRI對(duì)患者和對(duì)照組進(jìn)行分類(lèi),或者預(yù)測(cè)疾病預(yù)后(disease prognosis)和指導(dǎo)治療。另一類(lèi)研究探討了個(gè)體在認(rèn)知特征上的差異在多大程度上可以通過(guò)RSFC的差異來(lái)預(yù)測(cè),產(chǎn)生了有希望的結(jié)果。預(yù)測(cè)方法也可以用來(lái)解決神經(jīng)科學(xué)中感興趣的研究問(wèn)題。例如,RSFC是可遺傳的嗎?這樣的問(wèn)題可以在一個(gè)預(yù)測(cè)框架內(nèi)表述出來(lái),以檢驗(yàn)新的假設(shè)。從映射功能網(wǎng)絡(luò)到進(jìn)行個(gè)體水平的預(yù)測(cè),機(jī)器學(xué)習(xí)在rs-fMRI中的應(yīng)用意義深遠(yuǎn)。本文旨在以簡(jiǎn)明的方式介紹機(jī)器學(xué)習(xí)在從rs-fMRI數(shù)據(jù)中產(chǎn)生開(kāi)創(chuàng)性見(jiàn)解方面所起的作用,并描述機(jī)器學(xué)習(xí)在rs-fMRI中應(yīng)用的發(fā)展。作者將介紹rs-fMRI中機(jī)器學(xué)習(xí)的關(guān)鍵思想和應(yīng)用領(lǐng)域,而不是深入研究機(jī)器學(xué)習(xí)算法本身的精確技術(shù)差別。根據(jù)該領(lǐng)域的最新發(fā)展和潛力,作者討論了當(dāng)前的挑戰(zhàn)和未來(lái)工作的前景。1.1靜息態(tài)功能磁共振成像:歷史視角直到21世紀(jì)初,任務(wù)功能磁共振成像(task fMRI)一直是研究大腦不同區(qū)域功能的主要神經(jīng)成像工具,以及它們?nèi)绾螀f(xié)調(diào)以產(chǎn)生認(rèn)知功能的不同心理表征。Biswal等人在已知的皮層網(wǎng)絡(luò)中發(fā)現(xiàn)了相關(guān)的自發(fā)波動(dòng)。大量的后續(xù)研究已經(jīng)證實(shí)了rs-fMRI是探索大腦功能結(jié)構(gòu)的有用工具。在過(guò)去的十年里,采用靜息態(tài)范式的研究規(guī)模空前擴(kuò)大。這些方案比其他基于任務(wù)的實(shí)驗(yàn)簡(jiǎn)單得多,能夠?qū)】荡竽X的功能連接及其在疾病中的破壞提供關(guān)鍵的見(jiàn)解。靜息狀態(tài)也很有吸引力,因?yàn)樗试S多個(gè)部位的協(xié)作,不像任務(wù)功能磁共振成像那樣容易受到局部實(shí)驗(yàn)環(huán)境的干擾。這使得網(wǎng)絡(luò)分析達(dá)到了前所未有的規(guī)模。傳統(tǒng)上,rs-fMRI研究的重點(diǎn)是通過(guò)基于種子的分析(SBA)來(lái)識(shí)別空間上有區(qū)別但功能上相關(guān)的大腦區(qū)域。該方法先選擇種子體素或感興趣區(qū)域,然后將每個(gè)種子的時(shí)間序列與來(lái)自所有腦體素的時(shí)間序列相關(guān)聯(lián),生成一系列相關(guān)圖。SBA雖然簡(jiǎn)單且易于解釋?zhuān)捎谄浜艽蟪潭壬先Q于人工種子選擇,并且在其最簡(jiǎn)單的形式下,一次只能顯示一個(gè)特定的功能系統(tǒng),因此受到限制。像獨(dú)立成分分析(ICA)這樣的分解方法,在21世紀(jì)初成為種子相關(guān)分析的一種非常有前途的替代方法。其次是其他無(wú)監(jiān)督學(xué)習(xí)技術(shù),如聚類(lèi)。與基于種子的方法相比,這種方法探索與種子相關(guān)的網(wǎng)絡(luò)體素(如運(yùn)動(dòng)或視覺(jué)功能連接圖),這些基于分解或聚類(lèi)的新的無(wú)模型(model-free)方法同時(shí)在整個(gè)大腦中探索靜息態(tài)網(wǎng)絡(luò)(RSN),用于個(gè)體或群體水平的分析。不管使用何種分析工具,所有的研究基本上都集中在報(bào)告了大腦中多個(gè)穩(wěn)定的靜息態(tài)網(wǎng)絡(luò),如:初級(jí)感覺(jué)運(yùn)動(dòng)網(wǎng)絡(luò)、初級(jí)視覺(jué)網(wǎng)絡(luò)、額頂葉注意網(wǎng)絡(luò)和研究得很好的默認(rèn)網(wǎng)絡(luò)。默認(rèn)網(wǎng)絡(luò)中的區(qū)域,如后扣帶皮質(zhì)、楔前葉、腹側(cè)和背側(cè)內(nèi)側(cè)前額葉皮質(zhì),在靜息狀態(tài)下表現(xiàn)出活動(dòng)水平的增加,這表明該網(wǎng)絡(luò)代表了人腦的基本功能或默認(rèn)功能。默認(rèn)網(wǎng)絡(luò)引起了rs-fMRI社區(qū)的極大興趣,因此,一些研究探索了各種神經(jīng)和精神疾?。òㄗ蚤]癥、精神分裂癥和阿爾茨海默氏癥)中大腦默認(rèn)網(wǎng)絡(luò)(DMN)靜息狀態(tài)連接的中斷。盡管rs-fMRI技術(shù)獲得了廣泛的成功和普及,但靜息狀態(tài)下大腦持續(xù)自發(fā)波動(dòng)的原因仍不清楚。有幾項(xiàng)研究探討了靜息狀態(tài)下的相干起伏是神經(jīng)元起源的,還是僅僅是心臟或呼吸周期引起的混疊或生理偽影的表現(xiàn)。隨著時(shí)間的推移,支持基于BOLD的靜息狀態(tài)功能連接的神經(jīng)元基礎(chǔ)證據(jù)已經(jīng)從多個(gè)互補(bǔ)的來(lái)源積累起來(lái)。這包括:(a)在獨(dú)立受試者隊(duì)列中觀(guān)察到的靜息狀態(tài)功能連通性(RSFC)模式的再現(xiàn)性;(b)在沒(méi)有混疊和與噪聲成分明顯分離的情況下具有持續(xù)性;(c)其與已知功能網(wǎng)絡(luò)的相似性;(e)它與大腦皮層活動(dòng)的關(guān)系用其他方法研究;1.2機(jī)器學(xué)習(xí)在rs-fMRI中的應(yīng)用絕大多數(shù)關(guān)于rs-fMRI機(jī)器學(xué)習(xí)的文獻(xiàn)都致力于無(wú)監(jiān)督的學(xué)習(xí)方法。與任務(wù)驅(qū)動(dòng)的研究不同,模擬靜息狀態(tài)的活動(dòng)并不簡(jiǎn)單,因?yàn)闆](méi)有可控的刺激來(lái)驅(qū)動(dòng)這些波動(dòng)。因此,用于描述在基于任務(wù)的fMRI中觀(guān)察到的時(shí)空模式的分析方法通常不適用于rs-fMRI(圖1)。鑒于功能磁共振成像數(shù)據(jù)的高維特性,早期的分析方法側(cè)重于分解或聚類(lèi)技術(shù),以獲得更好的時(shí)空數(shù)據(jù)特征。像ICA這樣的無(wú)監(jiān)督學(xué)習(xí)方法催化了靜息狀態(tài)網(wǎng)絡(luò)或RSN的發(fā)現(xiàn)。隨后,靜息狀態(tài)腦圖繪制的領(lǐng)域擴(kuò)大了,主要目標(biāo)是創(chuàng)建腦分組,即描述大腦內(nèi)部功能一致的空間分區(qū)的體素(或在表面表示的情況下的頂點(diǎn))的最佳分組。這些分區(qū)通過(guò)提供探索大腦連通性和功能的區(qū)域參考圖,有助于理解人類(lèi)的功能組織。此外,它們還作為一種流行的數(shù)據(jù)簡(jiǎn)化技術(shù)用于統(tǒng)計(jì)分析或有監(jiān)督的機(jī)器學(xué)習(xí)。最近,從大腦網(wǎng)絡(luò)的靜態(tài)表征出發(fā),研究表明,在典型的磁共振功能掃描過(guò)程中,RSFC表現(xiàn)出有意義的變化。由于靜止?fàn)顟B(tài)下的大腦活動(dòng)在很大程度上是不受控制的,這使得網(wǎng)絡(luò)動(dòng)力學(xué)更加有趣。使用無(wú)監(jiān)督的模式發(fā)現(xiàn)方法,靜息狀態(tài)模式已經(jīng)被證明在離散的循環(huán)功能連接“狀態(tài)”之間轉(zhuǎn)換,代表不同的心理過(guò)程。在最簡(jiǎn)單和最常見(jiàn)的情況下,動(dòng)態(tài)功能連接性使用滑動(dòng)窗口相關(guān)性來(lái)表示。在這種方法中,在固定長(zhǎng)度的時(shí)間窗口中估計(jì)功能連通性,隨后通過(guò)不同的時(shí)間步長(zhǎng)移動(dòng)該時(shí)間窗口以產(chǎn)生相關(guān)矩陣序列。然后,通過(guò)分解或聚類(lèi),可以從這個(gè)序列中識(shí)別重復(fù)出現(xiàn)的相關(guān)模式(圖2)。這種功能連接的動(dòng)態(tài)性質(zhì)為理解大腦中不同連接的靈活性開(kāi)辟了新的途徑,因?yàn)樗鼈兣c行為動(dòng)力學(xué)相關(guān),具有潛在的臨床應(yīng)用價(jià)值。圖2.機(jī)器學(xué)習(xí)方法在靜息態(tài)fMRI中的應(yīng)用另一個(gè),也許在臨床上更有前景的機(jī)器學(xué)習(xí)在rs-fMRI中的應(yīng)用在2000年末得到了擴(kuò)展。這種新的應(yīng)用類(lèi)別利用監(jiān)督機(jī)器學(xué)習(xí)進(jìn)行個(gè)體水平預(yù)測(cè)。靜息態(tài)活動(dòng)的協(xié)方差結(jié)構(gòu),更普遍地被稱(chēng)為“連接體”,作為疾病的敏感生物標(biāo)志物,在神經(jīng)科學(xué)領(lǐng)域引起了極大的興趣。研究進(jìn)一步表明,一個(gè)人的連接體是獨(dú)特和可靠的,類(lèi)似于指紋。機(jī)器學(xué)習(xí)可以利用這些基于神經(jīng)成像的生物標(biāo)志物來(lái)構(gòu)建診斷或預(yù)測(cè)工具。這些模型的可視化和解釋可以補(bǔ)充統(tǒng)計(jì)分析,為大腦疾病中靜息狀態(tài)模式的功能障礙提供新的見(jiàn)解。鑒于深度學(xué)習(xí)在當(dāng)今時(shí)代的突出地位,幾種新的基于神經(jīng)網(wǎng)絡(luò)的方法也已經(jīng)出現(xiàn),用于分析rs-fMRI數(shù)據(jù)。這些方法中的大多數(shù)都是針對(duì)單個(gè)受試者水平預(yù)測(cè)的連接體特征提取。為了組織這一迅速發(fā)展的領(lǐng)域的工作,作者將機(jī)器學(xué)習(xí)方法按方法和應(yīng)用重點(diǎn)細(xì)分為不同的類(lèi)。作者首先根據(jù)無(wú)監(jiān)督學(xué)習(xí)方法的主要關(guān)注點(diǎn)是發(fā)現(xiàn)(a)反映在連貫波動(dòng)中的潛在空間組織,(b)恢復(fù)狀態(tài)連通性的時(shí)間動(dòng)態(tài)結(jié)構(gòu),還有(c)被試者之間比較的群體水平結(jié)構(gòu)。接下來(lái),作者繼續(xù)討論有監(jiān)督學(xué)習(xí)。作者通過(guò)討論這些模型中使用的相關(guān)rs-fMRI特征來(lái)組織這一部分,接著討論常用的訓(xùn)練算法,最后討論rs-fMRI在執(zhí)行預(yù)測(cè)方面顯示出前景的各種應(yīng)用領(lǐng)域。2.無(wú)監(jiān)督學(xué)習(xí)方法無(wú)監(jiān)督學(xué)習(xí)的主要目標(biāo)是發(fā)現(xiàn)潛在的表示,并解開(kāi)豐富的、未標(biāo)記的數(shù)據(jù)中變化的解釋因素。這些學(xué)習(xí)方法沒(méi)有受到任何形式的目標(biāo)輸出(或標(biāo)簽)的監(jiān)督來(lái)指導(dǎo)學(xué)習(xí)過(guò)程。相反,他們專(zhuān)注于學(xué)習(xí)數(shù)據(jù)中的結(jié)構(gòu),以便從噪聲中提取相關(guān)信號(hào)。下面,作者回顧一些重要的無(wú)監(jiān)督學(xué)習(xí)方法:2.1聚類(lèi)給定數(shù)據(jù)點(diǎn){X1,…,Xn},聚類(lèi)的目標(biāo)是將數(shù)據(jù)劃分成K個(gè)不相交的組{C1,…,CK}。不同的聚類(lèi)算法在它們的聚類(lèi)目標(biāo)方面是不同的,即最大化聚類(lèi)內(nèi)相似性和聚類(lèi)間的差異性(圖3)。圖3.用于rs-fMRI分析的無(wú)監(jiān)督學(xué)習(xí)方法的分類(lèi)K-means聚類(lèi)是目前最流行的數(shù)據(jù)分割學(xué)習(xí)算法。該算法旨在最小化聚類(lèi)內(nèi)方差。在形式上,這對(duì)應(yīng)于下面的聚類(lèi)目標(biāo):其中nj表示集合Cj的基數(shù)(cardinality)。這個(gè)優(yōu)化問(wèn)題是使用迭代算法來(lái)解決的,該算法被稱(chēng)為Lloyd算法。該算法從聚類(lèi)質(zhì)心的初始估計(jì)開(kāi)始,并通過(guò)(a)將每個(gè)數(shù)據(jù)分配給其最近的聚類(lèi),以及(b)基于這些新的分配更新聚類(lèi)質(zhì)心來(lái)迭代地細(xì)化它們。如果您對(duì)腦影像數(shù)據(jù)處理感興趣,歡迎瀏覽思影科技課程及服務(wù),特別是機(jī)器學(xué)習(xí)(可添加微信號(hào)siyingyxf或18983979082咨詢(xún)):第十三屆腦影像機(jī)器學(xué)習(xí)班(南京,12.13-18) 第十一屆磁共振腦影像結(jié)構(gòu)班(南京,1.12-17) 第三十六屆磁共振腦影像基礎(chǔ)班(南京,2021.1.6-11) 第十五屆DTI數(shù)據(jù)處理班(南京,12.26-31) 第十九屆磁共振腦網(wǎng)絡(luò)班(南京,1.18-23) 第七屆任務(wù)態(tài)fMRI專(zhuān)題班(重慶,1.14-19) 第三十五屆磁共振腦影像基礎(chǔ)班(重慶,11.30-12.5) 第三十七屆磁共振腦影像基礎(chǔ)班(重慶,1.23-28) 高斯混合模型的最大似然估計(jì)通常使用期望最大化算法獲得。 基于圖的聚類(lèi)形成了另一種基于相似性的數(shù)據(jù)劃分方法,可以使用圖來(lái)表示。給定一個(gè)有頂點(diǎn)集V和邊集E的加權(quán)無(wú)向圖G = {V,E},大多數(shù)圖分割方法都優(yōu)化了一個(gè)分離度量,如歸一化分割(Ncut)。邊權(quán)重w(i,j)表示頂點(diǎn)i和j之間的相似性函數(shù)。Ncut計(jì)算連接兩個(gè)分區(qū)的總邊權(quán)重,并通過(guò)它們與圖中所有節(jié)點(diǎn)的加權(quán)連接對(duì)其進(jìn)行歸一化。一個(gè)雙向規(guī)范化分割準(zhǔn)則通過(guò)同時(shí)最小化簇間相似度和最大化簇內(nèi)相似度,將G劃分為不相交的分區(qū)A和B。該客觀(guān)標(biāo)準(zhǔn)表示為:然而,直接最小化這個(gè)目標(biāo)是一個(gè)NP-hard(非確定性多項(xiàng)式)問(wèn)題。譜聚類(lèi)算法通??梢越鉀Q這個(gè)問(wèn)題。這種方法可以進(jìn)一步擴(kuò)展,以獲得圖的K路劃分。與k均值聚類(lèi)或?qū)哟尉垲?lèi)相比,基于圖的聚類(lèi)方法通常對(duì)異常值更具彈性(圖4)。圖4.流行的聚類(lèi)算法的說(shuō)明:K-means聚類(lèi)將數(shù)據(jù)空間劃分為Voronoi單元,其中每個(gè)觀(guān)察值都被分配給質(zhì)心最近的聚類(lèi)(圖中標(biāo)記為紅色)。高斯假設(shè)每個(gè)聚類(lèi)都是從多元高斯分布中采樣的,并估計(jì)這些概率密度,以生成不同聚類(lèi)的觀(guān)測(cè)值的概率分配。分層聚類(lèi)生成嵌套分區(qū),其中分區(qū)基于連接標(biāo)準(zhǔn)迭代合并?;趫D的聚類(lèi)劃分了數(shù)據(jù)的圖表示例如,連接不同聚類(lèi)的邊的數(shù)量是最小的。 2.2潛在變量模型基于分解或因式分解的方法假設(shè)觀(guān)察到的數(shù)據(jù)可以分解為更簡(jiǎn)單的矩陣的乘積,通常在這些單獨(dú)的矩陣上強(qiáng)加特定的結(jié)構(gòu)或稀疏性。形式上,給定數(shù)據(jù)點(diǎn)X = [x1,…,xn]利用xi∈ RD,線(xiàn)性分解技術(shù)尋找基集合W = [w1,…,wK]使得W所跨越的線(xiàn)性空間緊密重構(gòu)X。這里,每個(gè)數(shù)據(jù)點(diǎn)xi由基集合W的唯一系數(shù)zi∈RK表征。典型地,K < D,因此分解相當(dāng)于降維。在矩陣表示法中,目標(biāo)是找到W和Z,使得X ≈ WZ,其中Z = [z1,…,zn]。這個(gè)不適定問(wèn)題( ill-posed)一般通過(guò)約束W或z的結(jié)構(gòu)來(lái)解決。主成分分析(PCA)是一種基于線(xiàn)性投影并廣泛用于降維的技術(shù)。主成分分析的目標(biāo)是找到一個(gè)正交基W,使投影數(shù)據(jù)Z = WTX捕獲的方差最大化。這相當(dāng)于最小化基于低維表示數(shù)據(jù)點(diǎn)Z的重建誤差( reconstruction error)。從數(shù)學(xué)上講,這相當(dāng)于解決了下面的優(yōu)化問(wèn)題:其中F表示Frobenius范數(shù),而表示D×K維正交矩陣的集合。 獨(dú)立成分分析(ICA)是一種流行的方法,用于將數(shù)據(jù)分解為統(tǒng)計(jì)獨(dú)立成分的線(xiàn)性組合。在ICA術(shù)語(yǔ)中,W通常被稱(chēng)為混合矩陣,而Z包括源信號(hào)。在上述形式中,ICA假設(shè)源,即Z的行在統(tǒng)計(jì)上是獨(dú)立的。使用“白化”或“解混”矩陣U恢復(fù)源信號(hào),其中U = W-1.由于X = WZ,作者獲得了Z = UX流行的算法,因此通過(guò)估計(jì)U來(lái)恢復(fù)源,使得UX的成分在統(tǒng)計(jì)上是獨(dú)立的。常見(jiàn)的獨(dú)立成分分析算法通過(guò)最小化源之間的互信息或最大化它們的非高斯性來(lái)模擬獨(dú)立性。獨(dú)立成分分析通常采用滿(mǎn)秩矩陣分解,并且通常在主成分分析之前進(jìn)行降維。稀疏字典學(xué)習(xí)被描述為線(xiàn)性分解問(wèn)題,類(lèi)似于ICA/PCA,但在組件Z上具有稀疏約束。這將導(dǎo)致以下形式的非凸優(yōu)化問(wèn)題:在大多數(shù)實(shí)際應(yīng)用中,這個(gè)優(yōu)化問(wèn)題通過(guò)用L1范數(shù)代替L0范數(shù)來(lái)緩解。 非負(fù)矩陣分解(NMF)是另一種降維技術(shù),它尋求數(shù)據(jù)矩陣X的低秩分解,對(duì)成分W和Z具有非負(fù)約束。通常,這對(duì)應(yīng)于解決以下優(yōu)化:隱馬爾可夫模型(HMM)是一類(lèi)針對(duì)序列數(shù)據(jù)的無(wú)監(jiān)督學(xué)習(xí)方法。它們被用來(lái)模擬一個(gè)馬爾可夫過(guò)程,其中觀(guān)測(cè)序列{x1,…,xT}被認(rèn)為是從一系列潛在的隱藏狀態(tài){s1,…,sT},可以是離散的。在一個(gè)有K個(gè)狀態(tài)的隱馬爾可夫模型中,假設(shè)si可以取{1,…,K} ,HMM的參數(shù)是通過(guò)對(duì)完整的數(shù)據(jù)最大化似然學(xué)習(xí)來(lái)的:這里,P(s1|s0)表示初始狀態(tài)分布π。狀態(tài)轉(zhuǎn)移概率由元素為Ti,j = P(st = j| st-1 =i)的轉(zhuǎn)移矩陣T定義。條件P(xt|st = k,θ)由發(fā)射概率E[k,xt]捕獲。因此,該概率模型的參數(shù)θ為{π,T,E}。這種最大似然估計(jì)問(wèn)題是利用期望最大化算法的一種特殊情況,即Baum-Welch算法來(lái)有效地解決的。2.3非線(xiàn)性嵌入LLE將數(shù)據(jù)投影到降維空間,同時(shí)保留數(shù)據(jù)點(diǎn)及其鄰域之間的局部距離。LLE算法分兩步進(jìn)行。首先,每個(gè)輸入Xi,i∈{ 1,…,n}近似為其K個(gè)最近鄰的線(xiàn)性組合。通過(guò)最小化重建誤差獲得線(xiàn)性子空間W,即這里,如果Xj不是Xi的K近鄰之一,Wij = 0。在第二步中,通過(guò)最小化嵌入成本函數(shù)來(lái)獲得低維嵌入Yi, 在后一種優(yōu)化中,W保持固定在Wopt,而Yi是優(yōu)化的。3.無(wú)監(jiān)督學(xué)習(xí)在rs-fMRI的應(yīng)用 無(wú)監(jiān)督的機(jī)器學(xué)習(xí)方法已被證明有希望用于分析具有復(fù)雜結(jié)構(gòu)的高維數(shù)據(jù),使其與rs-fMRI更加相關(guān)。rs-fMRI中的許多無(wú)監(jiān)督學(xué)習(xí)方法旨在將大腦分成離散的功能子單元,類(lèi)似于地圖集。這些分割是由功能數(shù)據(jù)驅(qū)動(dòng)的,不像Broadmann圖譜那樣使用細(xì)胞結(jié)構(gòu),也不像自動(dòng)解剖標(biāo)記(AAL)圖譜那樣使用宏觀(guān)解剖特征。第二類(lèi)探索研究大腦網(wǎng)絡(luò)動(dòng)力學(xué)。無(wú)監(jiān)督學(xué)習(xí)被應(yīng)用于研究動(dòng)態(tài)功能連接體,并取得了令人滿(mǎn)意的結(jié)果。最后,無(wú)監(jiān)督學(xué)習(xí)的第三個(gè)應(yīng)用側(cè)重于學(xué)習(xí)RSFC的潛在低維表示,以對(duì)一群受試者進(jìn)行分析。作者將在下面討論這些具有挑戰(zhàn)性的應(yīng)用領(lǐng)域的方法。3.1發(fā)現(xiàn)具有相干起伏的空間模式 繪制功能不同的神經(jīng)解剖結(jié)構(gòu)的邊界,或識(shí)別大腦中功能耦合區(qū)域的簇是神經(jīng)科學(xué)的一個(gè)主要目標(biāo)。磁共振成像和機(jī)器學(xué)習(xí)方法為實(shí)現(xiàn)這一崇高目標(biāo)提供了一個(gè)有前途的組合。 在rs-fMRI中,典型的方法是利用ICA等技術(shù)將4D-fMRI數(shù)據(jù)分解成不同空間模式的線(xiàn)性疊加,這些模式顯示出連貫的時(shí)間動(dòng)態(tài)。聚類(lèi)是一種非監(jiān)督學(xué)習(xí)方法,用于分析rs-fMRI數(shù)據(jù)。與ICA或字典學(xué)習(xí)不同,聚類(lèi)用于劃分大腦表面(或體積)形成不相交的功能網(wǎng)絡(luò)。在這一階段,區(qū)分兩種稍有不同的聚類(lèi)應(yīng)用是很重要的,因?yàn)樗鼈冇袝r(shí)需要不同的約束:一個(gè)方向側(cè)重于識(shí)別通常在空間上分布的功能網(wǎng)絡(luò),而另一個(gè)方向則用于劃分大腦區(qū)域。后一種應(yīng)用旨在構(gòu)建功能性神經(jīng)解剖的局部區(qū)域的地圖集,就像自動(dòng)解剖標(biāo)記(AAL)等標(biāo)準(zhǔn)地圖集如何描繪宏觀(guān)解剖區(qū)域。在聚類(lèi)應(yīng)用中,一個(gè)重要的設(shè)計(jì)決策是用來(lái)度量不同體素(或頂點(diǎn))之間的差異性的距離函數(shù)。在rs-fMRI的情況下,這個(gè)距離函數(shù)要么在體素處的原始時(shí)間序列上計(jì)算,要么在它們的連通性輪廓之間計(jì)算。雖然這兩個(gè)距離的動(dòng)機(jī)是相同的功能一致性思想,但在使用任何一個(gè)標(biāo)準(zhǔn)進(jìn)行優(yōu)化的分組中發(fā)現(xiàn)了某些差異。 幾乎所有這些方法的一個(gè)重要要求是預(yù)先選擇簇/組件的數(shù)量。這些通常是通過(guò)交叉驗(yàn)證或統(tǒng)計(jì)來(lái)確定的,這些統(tǒng)計(jì)數(shù)據(jù)反映了不同尺度下分解/分割的質(zhì)量、穩(wěn)定性或再現(xiàn)性。 ICA是rs-fMRI最早和應(yīng)用最廣泛的分析工具之一,它推動(dòng)了對(duì)大腦內(nèi)在網(wǎng)絡(luò)的一些關(guān)鍵的神經(jīng)科學(xué)見(jiàn)解。當(dāng)應(yīng)用于rs-fMRI時(shí),大腦活動(dòng)表現(xiàn)為不同的空間模式或地圖的線(xiàn)性疊加,每一張地圖都遵循其特有的時(shí)間進(jìn)程(圖5)。這些空間地圖可以反映出一個(gè)連貫的功能系統(tǒng)或噪聲,并且可以使用幾個(gè)標(biāo)準(zhǔn)來(lái)自動(dòng)區(qū)分它們。這種隔離噪聲源的能力使得ICA特別有吸引力。在rs-fMRI的早期,幾項(xiàng)研究表明ICA空間圖和任務(wù)激活研究中已知的皮層功能網(wǎng)絡(luò)有顯著的相似性。當(dāng)?shù)湫偷莫?dú)立成分分析模型是無(wú)噪聲的并且假設(shè)唯一的隨機(jī)性是在信號(hào)源中時(shí),人們提出了幾種獨(dú)立成分分析的變體來(lái)模擬觀(guān)測(cè)信號(hào)中的加性噪聲。貝克曼等人提出了一種概率ICA(PICA)模型來(lái)提取rs-fMRI數(shù)據(jù)的連通結(jié)構(gòu)。在加性噪聲破壞和源之間統(tǒng)計(jì)獨(dú)立性的情況下,PICA對(duì)線(xiàn)性瞬時(shí)混合過(guò)程建模。De Luca等人結(jié)果表明,PICA能夠可靠地區(qū)分rsn和偽影。這兩部作品在多個(gè)被試的休息狀態(tài)模式上表現(xiàn)出高度一致性。雖然沒(méi)有標(biāo)準(zhǔn)來(lái)驗(yàn)證ICA模式,或任何聚類(lèi)算法,可重復(fù)性或可靠性通常用于定量評(píng)估。最近,Khorshidi等人提出了一種基于ICA的fMRI自動(dòng)去噪策略,稱(chēng)為FIX“FMRIB's ICA-based-X-noiseifier”。作者使用人工標(biāo)注訓(xùn)練了一個(gè)分類(lèi)器,以基于不同的空間/時(shí)間特征來(lái)標(biāo)記事實(shí)成分。這些成分可以表示各種結(jié)構(gòu)化噪聲源,一旦識(shí)別出來(lái),它們可以從數(shù)據(jù)中減去或回歸,以產(chǎn)生干凈的信號(hào)。圖5.應(yīng)用示意圖(第3.1節(jié)):在分解中,原始功能磁共振成像數(shù)據(jù)表示為空間模式及其相關(guān)時(shí)間序列的線(xiàn)性組合-獨(dú)立成分分析,空間地圖的獨(dú)立性得到優(yōu)化,而在稀疏字典學(xué)習(xí)中,地圖的稀疏性得到鼓勵(lì)。在聚類(lèi)中,體素的時(shí)間序列或連通性指紋被聚類(lèi),以將體素分配給不同的功能網(wǎng)絡(luò)。 ICA還可以擴(kuò)展到人口研究中的群體推理。到目前為止,組獨(dú)立成分分析是最廣泛使用的策略,在實(shí)施獨(dú)立成分分析之前,多組受試者功能磁共振成像數(shù)據(jù)沿時(shí)間維度串聯(lián)。然后,通過(guò)反向投影組混合矩陣,或者使用雙重回歸方法,可以從該組分解中獲得個(gè)體水平的獨(dú)立成分分析圖。最近,杜等引入了一種組信息引導(dǎo)的獨(dú)立成分分析方法,以保持單個(gè)獨(dú)立成分分析的統(tǒng)計(jì)獨(dú)立性,其中組獨(dú)立成分分析用于約束相應(yīng)的被試水平獨(dú)立成分分析。Varoquaux等人提出了一個(gè)穩(wěn)健的群體水平獨(dú)立成分分析模型,以方便群體間獨(dú)立成分分析的比較。他們引入了一個(gè)生成框架來(lái)對(duì)獨(dú)立成分分析模式中的兩個(gè)層次的方差進(jìn)行建模,在組層次和被試層次,類(lèi)似于混合效應(yīng)模型的多變量版本。IC估計(jì)程序,稱(chēng)為標(biāo)準(zhǔn)獨(dú)立成分分析。使用典型相關(guān)分析來(lái)識(shí)別受試者之間的共同IC模式的聯(lián)合子空間,并產(chǎn)生能夠很好地代表群體的IC。 或者,也可以計(jì)算個(gè)體特定的獨(dú)立成分分析圖,然后在它們之間建立對(duì)應(yīng)關(guān)系,以生成群體推理;然而,這種方法受到了限制,因?yàn)椴煌茉囌咧g的源分離可能非常不同,例如,由于碎片化。盡管獨(dú)立成分分析及其擴(kuò)展已被功能磁共振成像社區(qū)廣泛使用,但重要的是要承認(rèn)其局限性。獨(dú)立成分分析對(duì)非高斯數(shù)據(jù)的線(xiàn)性表示進(jìn)行建模。線(xiàn)性變換能否充分捕捉獨(dú)立潛在源(independent latent sources)和觀(guān)察到的高維功能磁共振成像數(shù)據(jù)之間的關(guān)系是不確定的,也可能是不現(xiàn)實(shí)的。與流行的主成分分析不同,獨(dú)立成分分析不提供其成分的順序或能量,這使得無(wú)法區(qū)分強(qiáng)源和弱源。這也使可復(fù)制性分析變得復(fù)雜??臻g地圖可以任意順序表達(dá)。提取有意義的IC有時(shí)也需要手動(dòng)選擇程序,這可能是低效或主觀(guān)的。在理想情況下,每個(gè)單獨(dú)的成分代表一個(gè)生理上有意義的激活模式或噪聲。然而,這對(duì)于rs-fMRI來(lái)說(shuō)可能是一個(gè)不切實(shí)際的假設(shè)。此外,由于獨(dú)立成分分析假設(shè)源的非高斯性,高斯生理噪聲會(huì)污染提取的成分。此外,由于功能磁共振成像的高維數(shù),在應(yīng)用獨(dú)立成分分析之前,分析通常進(jìn)行基于主成分分析的降維。主成分分析從數(shù)據(jù)協(xié)方差矩陣的頂部特征向量計(jì)算最高方差的不相關(guān)線(xiàn)性變換(從而解釋數(shù)據(jù)中最大的可變性)。雖然這一步驟有助于消除觀(guān)察噪聲,但它也可能導(dǎo)致信號(hào)信息的丟失,而這些信息對(duì)于后續(xù)分析可能至關(guān)重要。盡管ICA針對(duì)獨(dú)立性進(jìn)行了優(yōu)化,但并不保證獨(dú)立性?;趯?duì)大腦內(nèi)部功能整合的研究,從神經(jīng)科學(xué)的角度來(lái)看,功能單位之間獨(dú)立性的假設(shè)本身就可能受到質(zhì)疑。幾篇論文表明,當(dāng)空間模式稀疏,重疊可以忽略或很少時(shí),獨(dú)立成分分析特別有效。這暗示了獨(dú)立成分分析的成功是由成分的稀疏性而不是它們的獨(dú)立性驅(qū)動(dòng)的可能性。根據(jù)這些思路,道貝希和他的同事聲稱(chēng),優(yōu)化空間模式稀疏性的功能磁共振成像表示比優(yōu)化獨(dú)立性的功能磁共振成像表示更有效。稀疏字典學(xué)習(xí)是另一種構(gòu)建觀(guān)測(cè)數(shù)據(jù)簡(jiǎn)潔表示的流行框架。Varoquaux等人采用字典學(xué)習(xí)框架從靜息狀態(tài)功能磁共振成像時(shí)間序列中分割功能區(qū)域。他們的方法通過(guò)允許特定被試的空間地圖不同于人口級(jí)別的地圖集,來(lái)說(shuō)明功能邊界中被試間的可變性。具體地說(shuō),它們優(yōu)化了損失函數(shù),該損失函數(shù)包括測(cè)量數(shù)據(jù)及其因式分解之間的近似誤差的殘差項(xiàng)、懲罰個(gè)體主體空間圖與組級(jí)潛在圖的大偏差的代價(jià)項(xiàng)、以及促進(jìn)稀疏性的正則化項(xiàng)。除了稀疏性之外,它們還強(qiáng)加了一個(gè)平滑性約束,以便每個(gè)字典中的主要模式在空間上是連續(xù)的,從而構(gòu)建一個(gè)定義明確的分組。為了防止由于平滑度約束而導(dǎo)致的邊緣模糊,亞伯拉罕等人在這個(gè)多被試字典學(xué)習(xí)框架內(nèi)(multi-subject dictionary learning framework)提出一個(gè)全變分正則化。在解釋測(cè)試數(shù)據(jù)時(shí),這種方法顯示出比競(jìng)爭(zhēng)方法如獨(dú)立分量分析和聚類(lèi)更好的結(jié)構(gòu)化分組。同樣,呂等人提出一種策略,通過(guò)將時(shí)間序列分解成基礎(chǔ)字典及其相應(yīng)的稀疏系數(shù),學(xué)習(xí)個(gè)體受試者全腦功能磁共振成像信號(hào)的稀疏表示。這里,字典代表功能網(wǎng)絡(luò)的共同激活模式,系數(shù)代表相關(guān)的空間地圖。實(shí)驗(yàn)顯示,與已知在實(shí)踐中產(chǎn)生空間不重疊成分的獨(dú)立分量分析相比,在提取的功能網(wǎng)絡(luò)中存在高度的空間重疊。3.1.3 k-means聚類(lèi)和混合模型k-means聚類(lèi)或混合模型常用于功能磁共振成像數(shù)據(jù)的空間分割。體素之間的相似性可以通過(guò)關(guān)聯(lián)它們的原始時(shí)間序列或連通性輪廓來(lái)定義。歐幾里德距離度量也被用于時(shí)間序列的頻譜特征。K-means聚類(lèi)為人腦的功能組織提供了一些新的見(jiàn)解。它揭示了大腦皮層自然分成兩個(gè)互補(bǔ)的系統(tǒng),內(nèi)部驅(qū)動(dòng)的“內(nèi)在”系統(tǒng)和刺激驅(qū)動(dòng)的“外在”系統(tǒng);為區(qū)域網(wǎng)絡(luò)的等級(jí)組織提供了證據(jù);并且暴露了對(duì)共同變化的靜息狀態(tài)波動(dòng)的解剖學(xué)貢獻(xiàn)。高蘭等人提出了一種高斯混合模型用于功能磁共振成像信號(hào)的聚類(lèi)。這里,每個(gè)體素處的信號(hào)被建模為N個(gè)高斯密度的加權(quán)和,其中N確定了假設(shè)的功能網(wǎng)絡(luò)的數(shù)量和反映分配給不同網(wǎng)絡(luò)的概率的權(quán)重。大規(guī)模的系統(tǒng)在幾個(gè)分辨率下被探索,揭示了功能組織的內(nèi)在層次。Yeo等人使用對(duì)1000名受試者的rs-fMRI測(cè)量來(lái)估計(jì)大規(guī)模分布式皮層網(wǎng)絡(luò)的組織。他們使用混合模型來(lái)識(shí)別具有相似皮質(zhì)(similar corticocortical)連接特征的體素簇。從穩(wěn)定性分析中選擇聚類(lèi)數(shù),并以7個(gè)網(wǎng)絡(luò)的粗略分辨率和17個(gè)網(wǎng)絡(luò)的精細(xì)尺度進(jìn)行分組。在數(shù)據(jù)樣本中獲得了高度的可復(fù)制性,表明這些網(wǎng)絡(luò)可以作為功能表征的可靠參考圖。幾項(xiàng)研究為大腦中功能網(wǎng)絡(luò)的分級(jí)組織提供了證據(jù)。因此,層次凝聚聚類(lèi)(HAC)為分割rs-fMRI數(shù)據(jù)和探索這種潛在的層次結(jié)構(gòu)提供了一個(gè)自然的工具。聚類(lèi)在靜息態(tài)磁共振成像中的最早應(yīng)用是基于HAC。這項(xiàng)技術(shù)在很大程度上證明了從rs-fMRI數(shù)據(jù)中提取RSN的聚類(lèi)可行性。HAC最近的應(yīng)用集中在為下游分析定義全腦分組。例如,通過(guò)僅考慮局部鄰域作為合并的潛在候選對(duì)象,可以小的分割框架中(in parcels)中加強(qiáng)空間連續(xù)性。分層聚類(lèi)的一個(gè)優(yōu)點(diǎn)是,與k-means聚類(lèi)不同,它不需要知道聚類(lèi)的數(shù)量,并且是完全確定的。然而,一旦聚類(lèi)樹(shù)形成,樹(shù)圖必須在最能表征“自然”聚類(lèi)的水平上被分割。這可以基于連接不一致性標(biāo)準(zhǔn)、受試者之間的一致性或高級(jí)經(jīng)驗(yàn)知識(shí)來(lái)確定。雖然層次聚類(lèi)是一種很有前途的rs-fMRI分析方法,但它有一些固有的局限性。它通常依賴(lài)于先驗(yàn)降維,例如通過(guò)使用解剖模板,這可以偏置最終的分組。這是一種貪婪的策略,早期的錯(cuò)誤劃分在后續(xù)迭代中無(wú)法糾正。單連接標(biāo)準(zhǔn)(Single-linkage criterion)在實(shí)踐中可能不太適用,因?yàn)樗谧罱従嚯x合并分區(qū),因此對(duì)有噪聲的靜息狀態(tài)信號(hào)并不具有固有的魯棒性。此外,不同的度量標(biāo)準(zhǔn)通常會(huì)優(yōu)化集群的不同屬性。例如,單連接集群鼓勵(lì)擴(kuò)展集群,而全連接集群則促進(jìn)緊湊性。這使得距離度量的先驗(yàn)選擇有些隨意。功能磁共振成像數(shù)據(jù)可以自然地以圖形的形式表示。這里,節(jié)點(diǎn)代表體素,邊代表連接強(qiáng)度,通常由體素時(shí)間序列之間或連接圖之間的相關(guān)系數(shù)來(lái)測(cè)。通常,在邊上應(yīng)用閾值來(lái)限制圖的復(fù)雜性。圖形分割方法,如基于Ncut(歸一化分割)標(biāo)準(zhǔn)的方法,已被廣泛用于推導(dǎo)全腦分割。群體水平的分組通常通過(guò)兩個(gè)階段的過(guò)程得出:首先,對(duì)單個(gè)圖進(jìn)行聚類(lèi)以提取功能相關(guān)的區(qū)域,然后是第二階段,對(duì)表征單個(gè)聚類(lèi)圖一致性的群體水平的圖進(jìn)行聚類(lèi)。通過(guò)將連通性圖約束到局部鄰域,或者通過(guò)使用形狀先驗(yàn)(shape priors),可以容易地實(shí)現(xiàn)空間連續(xù)性。從這個(gè)協(xié)議出發(fā),沈等人提出一種分組聚類(lèi)方法,該方法在單個(gè)階段聯(lián)合優(yōu)化個(gè)體和分組,并在沒(méi)有任何顯式約束的情況下產(chǎn)生空間平滑的組分組。功能磁共振成像Ncut標(biāo)準(zhǔn)的一個(gè)缺點(diǎn)是它偏向于創(chuàng)建大小一致的簇,而實(shí)際上功能區(qū)顯示出很大的大小差異。圖的構(gòu)建本身涉及到可能影響聚類(lèi)性能的任意決策,例如選擇一個(gè)閾值來(lái)限制圖形邊緣,或者選擇鄰域來(lái)加強(qiáng)空間連通性(表1)。(休息片刻,廣告之后,馬上回來(lái),點(diǎn)擊閱覽): 第十三屆腦影像機(jī)器學(xué)習(xí)班(南京,12.13-18)
3.1.6.1 基于交替的網(wǎng)絡(luò)連接表示方法一些論文對(duì)聚類(lèi)/分解和基于邊界檢測(cè)的網(wǎng)絡(luò)分割方法進(jìn)行了區(qū)分。在rs-fMRI文獻(xiàn)中,已經(jīng)提出了幾種基于非學(xué)習(xí)的分割方法,這些方法利用傳統(tǒng)的圖像分割算法來(lái)識(shí)別基于RSFC突變的功能區(qū)域。聚類(lèi)算法不要求空間連續(xù)性,而基于邊界的方法隱含地要求空間連續(xù)性。相比之下,基于邊界的方法無(wú)法表示長(zhǎng)期的功能關(guān)聯(lián),并且可能無(wú)法產(chǎn)生像無(wú)監(jiān)督學(xué)習(xí)方法那樣在連接上同質(zhì)的小的聚合(parcels)。這些方法的混合可以產(chǎn)生更好的表示大腦網(wǎng)絡(luò)組織的模型。謝弗等人最近用馬爾可夫隨機(jī)場(chǎng)模型探索了這個(gè)方向。與幾個(gè)交替梯度和基于學(xué)習(xí)的方案相比,生成的地塊顯示出優(yōu)異的同質(zhì)性。此外,以其他方式補(bǔ)充RSFC,可以為劃定區(qū)域邊界提供確鑿的、或許是補(bǔ)充性的信息。最近Glasser等人通過(guò)開(kāi)發(fā)一種產(chǎn)生大腦分割的多模態(tài)方法來(lái)解決這個(gè)問(wèn)題。作者提出了一種半自動(dòng)方法,該方法將有監(jiān)督的機(jī)器學(xué)習(xí)與基于多模態(tài)指紋(結(jié)構(gòu)、功能、連通性和地形)的區(qū)域分割的手動(dòng)標(biāo)注相結(jié)合。這種方法有助于實(shí)現(xiàn)精確繪制人腦功能圖的目標(biāo)。rs-fMRI文獻(xiàn)中的重要工作是致力于確定人群平均分組。潛在的假設(shè)是,功能連接圖顯示了跨被試的相似模式,并且這些全局劃分反映了共同的組織原則。然而,個(gè)體水平的分組可能會(huì)產(chǎn)生更敏感的連接特征,用于研究健康和疾病網(wǎng)絡(luò)。這項(xiàng)工作的一個(gè)主要挑戰(zhàn)是將個(gè)人層面的空間地圖與人口模板相匹配,以建立跨主體的對(duì)應(yīng)關(guān)系。獲得具有群組對(duì)應(yīng)的特定被試網(wǎng)絡(luò)的常見(jiàn)方法通常包括反投影和雙重回歸,或者無(wú)監(jiān)督學(xué)習(xí)中的分層先驗(yàn)。雖然許多研究已經(jīng)開(kāi)發(fā)了特定主題的分組,但是這種被試間可變性對(duì)于網(wǎng)絡(luò)分析的重要性直到最近才被討論??椎仁褂枚嚯A段分層貝葉斯模型開(kāi)發(fā)了高質(zhì)量的特定受試者分組,并表明特定受試者功能地形圖的可變性可以預(yù)測(cè)行為測(cè)量。最近,Salehi等人使用了一種新的基于K-medoids聚類(lèi)的分組方案。表明單獨(dú)的個(gè)體水平的分組可以預(yù)測(cè)個(gè)體的性別。這些研究提出了一個(gè)有趣的想法,即被試水平的網(wǎng)絡(luò)組織,即體素到網(wǎng)絡(luò)的分配可以捕捉個(gè)體固有的概念,就像連接強(qiáng)度一樣。3.1.6.3 有沒(méi)有通用的‘金標(biāo)準(zhǔn)’腦圖集?當(dāng)考慮一系列不同的方法、算法或模式時(shí),在不同的粒度級(jí)別上存在過(guò)多的不同的大腦分區(qū)。到目前為止,還沒(méi)有統(tǒng)一的框架來(lái)推理這些大腦細(xì)胞。可以使用幾個(gè)分類(lèi)來(lái)描述這些分組的生成,例如機(jī)器學(xué)習(xí)或邊界檢測(cè)、分解或聚類(lèi)、多模態(tài)或單峰。即使在一大類(lèi)聚類(lèi)方法中,也不可能找到一種算法能始終如一地優(yōu)于一組簡(jiǎn)單的、理想的劃分屬性。已經(jīng)出現(xiàn)了幾種用于比較不同分組的評(píng)估標(biāo)準(zhǔn),暴露了工作中固有的權(quán)衡。阿爾斯蘭等人根據(jù)來(lái)自人類(lèi)連接體項(xiàng)目(HCP)的靜息數(shù)據(jù),對(duì)不同方法下的幾個(gè)分組進(jìn)行了廣泛的比較。通過(guò)獨(dú)立評(píng)估,他們得出結(jié)論,在所有評(píng)估指標(biāo)中,沒(méi)有一個(gè)分組是始終如一的優(yōu)勢(shì)。最近薩萊希等人表明,不同的功能條件,如任務(wù)或休息,產(chǎn)生可重復(fù)的不同分組,從而質(zhì)疑最佳分組的存在,甚至在個(gè)人層面。這些新穎的研究需要重新思考大腦地圖的最終目標(biāo)。幾項(xiàng)研究反映了這樣一種觀(guān)點(diǎn),即大腦沒(méi)有最佳的功能分區(qū),而只是一系列有意義的大腦分區(qū)。也許,大腦繪圖不應(yīng)該像布羅德曼區(qū)域那樣,以識(shí)別普遍意義上的功能子單元為目標(biāo)。相反,人腦繪圖的目標(biāo)應(yīng)該重新制定為揭示一致的功能描述,從而能夠?qū)Υ竽X網(wǎng)絡(luò)進(jìn)行可靠和有意義的研究。在使用分解和聚類(lèi)提取的功能連貫?zāi)J街幸呀?jīng)觀(guān)察到高度的收斂。分解技術(shù)允許對(duì)數(shù)據(jù)進(jìn)行軟劃分,因此可以產(chǎn)生空間重疊的網(wǎng)絡(luò)。這些模型可能是大腦網(wǎng)絡(luò)的更自然的表示,例如,高度集成的區(qū)域,如網(wǎng)絡(luò)“中樞”,并且可以同時(shí)服務(wù)于多個(gè)功能系統(tǒng)。盡管有可能對(duì)生成的地圖進(jìn)行閾值劃分和重新標(biāo)記,以產(chǎn)生空間上連續(xù)的大腦分區(qū),但這些技術(shù)并不是自然設(shè)計(jì)來(lái)生成不相交的分區(qū)的。相比之下,聚類(lèi)技術(shù)會(huì)自動(dòng)將體素硬分配給不同的大腦網(wǎng)絡(luò)??臻g約束可以很容易地合并到不同的聚類(lèi)算法中,以生成連續(xù)的小的集合(contiguous parcels)。分解模型可以適應(yīng)變化的數(shù)據(jù)分布,而聚類(lèi)解決方案由于嚴(yán)格的聚類(lèi)目標(biāo)而允許更少的靈活性。例如,k-means聚類(lèi)函數(shù)尋找捕獲球形簇(spherical clusters)。雖然這些方法之間仍缺乏徹底的比較,但一些研究已經(jīng)確定了選擇兩種技術(shù)進(jìn)行分組之間的權(quán)衡。亞伯拉罕等人在兩個(gè)評(píng)估指標(biāo)上比較了聚類(lèi)方法與組獨(dú)立成分分析和字典學(xué)習(xí):穩(wěn)定性,反映在獨(dú)立數(shù)據(jù)的體素分配的再現(xiàn)性上,以及數(shù)據(jù)保真度,由獨(dú)立數(shù)據(jù)的解釋方差獲得。他們觀(guān)察到穩(wěn)定性和保真度之間的權(quán)衡:雖然聚類(lèi)模型產(chǎn)生穩(wěn)定區(qū)域,但不能很好地解釋測(cè)試數(shù)據(jù),但線(xiàn)性分解模型可以很好地解釋測(cè)試數(shù)據(jù),但代價(jià)是穩(wěn)定性降低。3.2.發(fā)現(xiàn)動(dòng)態(tài)功能連接的模式無(wú)監(jiān)督學(xué)習(xí)也被應(yīng)用于研究靜態(tài)網(wǎng)絡(luò)中的時(shí)間組織或動(dòng)態(tài)重構(gòu)模式。這些研究通?;趦蓚€(gè)交替的假設(shè),即(a)離散“連接狀態(tài)”之間的動(dòng)態(tài)(窗口)功能連接循環(huán),或者(b)任何時(shí)候的功能連接都可以表示為潛在“連接狀態(tài)”的組合。第一個(gè)假設(shè)使用基于聚類(lèi)的方法或生成模型(如HMMs)進(jìn)行檢驗(yàn),而第二個(gè)假設(shè)使用分解技術(shù)進(jìn)行建模。一旦在人群中確定了穩(wěn)定狀態(tài),前一種方法允許作者估計(jì)所有受試者在每個(gè)狀態(tài)下花費(fèi)的時(shí)間比例。這個(gè)量,稱(chēng)為停留時(shí)間或狀態(tài)占用,顯示了個(gè)體之間有意義的變化。重要的是要注意到,在所有這些方法中,RSN或空間模式被假設(shè)為隨著時(shí)間的推移而穩(wěn)定,并且時(shí)間一致性隨時(shí)間而變化。一些研究已經(jīng)發(fā)現(xiàn)了通過(guò)窗口相關(guān)矩陣的k-means聚類(lèi)的循環(huán)動(dòng)態(tài)功能連接模式,稱(chēng)為“狀態(tài)”。與這些重復(fù)狀態(tài)相關(guān)聯(lián)的功能梯度顯示出明顯不同于靜態(tài)功能梯度(圖6),表明網(wǎng)絡(luò)動(dòng)力學(xué)為靜息大腦提供了新的特征。在精神分裂癥、雙相情感障礙和類(lèi)似精神病的體驗(yàn)域中,健康對(duì)照和患者群體之間的多種狀態(tài)的停留時(shí)間存在顯著差異。圖6.應(yīng)用示意圖(第3.2節(jié))。為了便于說(shuō)明,數(shù)據(jù)中假設(shè)了三種連接狀態(tài)。Abrol等人進(jìn)行了一項(xiàng)大規(guī)模研究,使用標(biāo)準(zhǔn)的k-means以及更靈活、限制更寬松的(soft)k-means狀態(tài)估計(jì)算法來(lái)表征大腦狀態(tài)的可復(fù)制性。實(shí)驗(yàn)顯示了大多數(shù)狀態(tài)的再現(xiàn)性,以及它們的匯總度量,例如平均停留時(shí)間和轉(zhuǎn)移概率等。獨(dú)立人群樣本的研究表明,雖然這些研究證實(shí)了反復(fù)出現(xiàn)的FC狀態(tài)的存在,但這些狀態(tài)的行為聯(lián)系仍然未知。在一個(gè)有趣的作品中,王等人使用k-均值聚類(lèi)識(shí)別了兩個(gè)穩(wěn)定的動(dòng)態(tài)FC狀態(tài),這兩個(gè)狀態(tài)分別與高喚醒和低喚醒的內(nèi)部狀態(tài)相對(duì)應(yīng)。這表明RSFC波動(dòng)是行為狀態(tài)依賴(lài)的,并給出對(duì)RSFC的異質(zhì)性和動(dòng)態(tài)性質(zhì)的解釋。3.2.2狀態(tài)轉(zhuǎn)移動(dòng)力學(xué)的馬爾可夫模型HMM是另一個(gè)有價(jià)值的工具來(lái)詢(xún)問(wèn)循環(huán)的功能連接模式。狀態(tài)的概念仍然類(lèi)似于上文針對(duì)集群描述的“FC狀態(tài)”;然而,特征和估計(jì)是截然不同的。與使用滑動(dòng)窗口來(lái)計(jì)算動(dòng)態(tài)功能函數(shù)模式的聚類(lèi)不同,HMMs直接對(duì)rs-fMRI時(shí)間序列建模。因此,他們提供了一個(gè)有希望的替代方案來(lái)克服滑動(dòng)窗口在表征功能函數(shù)變化方面的統(tǒng)計(jì)限制。通過(guò)采用HMM,出現(xiàn)了一些有趣的結(jié)果。Vidaurre等人發(fā)現(xiàn)不同狀態(tài)的相對(duì)占用率是與行為特征和遺傳相關(guān)聯(lián)的特定受試者的量度。通過(guò)馬爾可夫模型,狀態(tài)之間的轉(zhuǎn)換被揭示為一個(gè)非隨機(jī)序列,它本身是分層組織的。最近,使用HMMs建模的網(wǎng)絡(luò)動(dòng)力學(xué)被證明能夠區(qū)分輕度認(rèn)知障礙患者和對(duì)照組,從而表明它們?cè)谂R床領(lǐng)域的實(shí)用性。3.2.3尋找跨時(shí)間點(diǎn)的潛在連接模式理解RSFC動(dòng)力學(xué)的分解技術(shù)與第2.2.1節(jié)中描述的方法有相同的味道:通過(guò)潛在因素解釋數(shù)據(jù);然而,在這種情況下,興趣的變化是跨時(shí)間的。矩陣分解技術(shù)的采用暴露了(exposes)來(lái)自窗口相關(guān)矩陣的FC模式的基本集合。使用各種分解方法對(duì)動(dòng)態(tài)功能連接(Dynamic FC)進(jìn)行了表征,包括:主成分分析,奇異值分解,非負(fù)矩陣分解和稀疏字典學(xué)習(xí)。這里,分解方法不同于聚類(lèi)或HMMs,因?yàn)樗鼈儗⒚總€(gè)dFC矩陣與多個(gè)潛在因素而不是單個(gè)組件相關(guān)聯(lián)。為了比較這些替代方法,萊昂納迪等人實(shí)現(xiàn)了廣義矩陣分解,稱(chēng)為kSVD。這種因式分解概括了受變量約束的k均值聚類(lèi)和主成分分析。本研究中的再現(xiàn)性分析表明,dFC更好地表征為多個(gè)重疊的FC模式(表2)。dFC的分解揭示了健康對(duì)照和PTSD或多發(fā)性硬化癥患者之間以及兒童期和年輕成年期之間網(wǎng)絡(luò)動(dòng)力學(xué)的新變化。3.3探究被試間差異的潛在因素無(wú)監(jiān)督學(xué)習(xí)也可以探究在人口上功能連接差異的潛在解釋因素。作者在這里發(fā)現(xiàn)了兩個(gè)應(yīng)用:(1)學(xué)習(xí)FC矩陣的低維嵌入,用于后續(xù)的監(jiān)督學(xué)習(xí);(2)學(xué)習(xí)群體分組,僅基于FC區(qū)分表型。Rs-fMRI分析受到維數(shù)災(zāi)難的困擾,即高維數(shù)據(jù)稀疏性增加的現(xiàn)象。常用的數(shù)據(jù)特性,如區(qū)域?qū)χg的FC,隨著分區(qū)區(qū)域的數(shù)量而增加。此外,典型功能磁共振成像研究中的樣本量通常為數(shù)十或數(shù)百個(gè)數(shù)量級(jí),這使得從原始高維數(shù)據(jù)中學(xué)習(xí)可歸納的模式變得更加困難(圖7)。為了克服這一點(diǎn),線(xiàn)性分解方法,如PCA或稀疏字典學(xué)習(xí)已被廣泛應(yīng)用于功能連接數(shù)據(jù)的降維。幾種非線(xiàn)性嵌入方法,如局部線(xiàn)性嵌入(LLE)或自動(dòng)編碼器(AEs)也引起了人們的注意。例如,LLE嵌入已被用于rs-fMRI研究,以改善監(jiān)督年齡回歸的預(yù)測(cè),或用于低維聚類(lèi)以區(qū)分精神分裂癥患者和對(duì)照組。AEs是一種基于神經(jīng)網(wǎng)絡(luò)的替代方法,用于通過(guò)非線(xiàn)性輸入變換生成簡(jiǎn)化的特征集。在一些研究中,它們已被用于RSFC特征降維。為了將學(xué)習(xí)引向支持泛化的參數(shù)空間,AEs也可用于監(jiān)督神經(jīng)網(wǎng)絡(luò)訓(xùn)練的預(yù)訓(xùn)練階段。這種技術(shù)被證明:如使用RSFC提高自閉癥和精神分裂癥的分類(lèi)性能。圖7.應(yīng)用示意圖(第3.3節(jié))。為了說(shuō)明,將高維連接體降維為3個(gè)潛在成分。聚類(lèi)可以暴露群體中顯示相似功能區(qū)的子群體。使用無(wú)監(jiān)督最大邊緣聚類(lèi),曾等證明了聚類(lèi)可以與疾病類(lèi)別(低v/s控制)相關(guān)聯(lián),從而產(chǎn)生高分類(lèi)精度。最近Drysdale等人基于RSFC發(fā)現(xiàn)了新的抑郁癥神經(jīng)生理學(xué)亞型。使用一種聚集的分層程序,他們確定了功能障礙連接的聚集模式,其中盡管沒(méi)有外部監(jiān)督,聚集顯示了與不同臨床癥狀特征的聯(lián)系。一些精神疾病,如抑郁癥、精神分裂癥和自閉癥譜系障礙,被認(rèn)為是高度異質(zhì)性的,臨床表現(xiàn)差異很大。基于疾病亞型的不同表征可以建立更好的診斷、預(yù)后或治療選擇系統(tǒng),而不是將其標(biāo)記為單一綜合征。無(wú)監(jiān)督聚類(lèi)有助于根據(jù)這些疾病的rs-fMRI表現(xiàn)識(shí)別其亞型(表3)。
4. 監(jiān)督學(xué)習(xí)有監(jiān)督學(xué)習(xí)表示一類(lèi)問(wèn)題,其中向?qū)W習(xí)系統(tǒng)提供數(shù)據(jù)的輸入特征和相應(yīng)的目標(biāo)預(yù)測(cè)(或標(biāo)簽)。目標(biāo)是學(xué)習(xí)輸入和標(biāo)簽之間的映射,以便系統(tǒng)可以為之前看不到的輸入數(shù)據(jù)點(diǎn)計(jì)算預(yù)測(cè)。從rs-fMRI相關(guān)性預(yù)測(cè)自閉癥是一個(gè)典型問(wèn)題。由于內(nèi)在功能因子反映了認(rèn)知相關(guān)功能網(wǎng)絡(luò)之間的相互作用,因此假設(shè)靜息狀態(tài)模式的系統(tǒng)改變可能與病理或認(rèn)知特征相關(guān)。通過(guò)使用rs-fMRI的監(jiān)督算法獲得的有希望的診斷準(zhǔn)確性構(gòu)成了這一假設(shè)的有力證據(jù)。在本節(jié)中,作者將rs-fMRI特征提取的討論從分類(lèi)算法和應(yīng)用領(lǐng)域中分離出來(lái)。4.1導(dǎo)出連接體特征為了使監(jiān)督學(xué)習(xí)有效,最關(guān)鍵的因素是特征提取。從rs-fMRI中獲取相關(guān)神經(jīng)表型取決于各種設(shè)計(jì)選擇。幾乎所有的監(jiān)督預(yù)測(cè)模型都使用從rs-fMRI時(shí)間序列中提取的腦網(wǎng)絡(luò)或“連接體”作為學(xué)習(xí)算法的輸入特征。原型的預(yù)測(cè)流程如圖8所示。在這里,作者討論了監(jiān)督學(xué)習(xí)中大腦網(wǎng)絡(luò)表示的常見(jiàn)選擇的關(guān)鍵方面。典型流程的第一步是區(qū)域定義和相應(yīng)的時(shí)間序列提取。從體素水平相關(guān)得到的密集連接體由于其高維數(shù)而很少在實(shí)踐中用于監(jiān)督預(yù)測(cè)。腦地圖集描繪了大腦中經(jīng)常用于在超體素尺度上研究RSFC的感興趣區(qū)域。每個(gè)感興趣區(qū)域用不同的時(shí)間過(guò)程表示,通常計(jì)算為感興趣區(qū)域內(nèi)所有體素的平均信號(hào)。因此,數(shù)據(jù)表示為一個(gè)N × T矩陣,其中N表示ROI的數(shù)量,T表示信號(hào)中的時(shí)間點(diǎn)。使用預(yù)定義圖譜的一個(gè)缺點(diǎn)是,它們可能不能很好地解釋rs-fMRI數(shù)據(jù)集,因?yàn)樗鼈儧](méi)有針對(duì)手頭的數(shù)據(jù)進(jìn)行優(yōu)化。一些研究使用數(shù)據(jù)驅(qū)動(dòng)技術(shù)來(lái)定義大腦中的區(qū)域,使用無(wú)監(jiān)督模型,如K均值聚類(lèi)、Ward聚類(lèi)、獨(dú)立分量分析或字典學(xué)習(xí)等。值得注意的是,由于作者使用對(duì)ROI定義整個(gè)大腦RSFC,因此隨著ROI的數(shù)量,這些特性會(huì)隨著ROI的數(shù)量而增長(zhǎng)為(N2)。因此,在大多數(shù)研究中,網(wǎng)絡(luò)粒度通常限制在10-400 ROI范圍內(nèi)。因此,在大多數(shù)研究中,網(wǎng)絡(luò)粒度通常被限制在10-400個(gè)感興趣區(qū)域的范圍內(nèi)。這個(gè)流程的第二步包括定義提取連接體矩陣的連接強(qiáng)度。在有監(jiān)督學(xué)習(xí)中,感興趣區(qū)域?qū)χg的功能連通性是功能磁共振成像最常見(jiàn)的特征表示。為了提取連通矩陣,首先需要估計(jì)協(xié)方差矩陣。由于時(shí)間點(diǎn)的數(shù)量有限,樣本協(xié)方差矩陣受到大量估計(jì)誤差的影響。這個(gè)不適定問(wèn)題可以通過(guò)使用收縮變換得到部分解決。然后可以通過(guò)多種方式從協(xié)方差矩陣中估計(jì)連接強(qiáng)度。皮爾遜相關(guān)系數(shù)是一種常用的估計(jì)功能連通性的度量標(biāo)準(zhǔn)。部分相關(guān)是另一個(gè)度量標(biāo)準(zhǔn),已被證明可以在模擬的rs-fMRI數(shù)據(jù)中更好地估計(jì)網(wǎng)絡(luò)連接。它在去除數(shù)據(jù)中所有其他時(shí)間序列的影響后,測(cè)量?jī)蓚€(gè)時(shí)間序列之間的歸一化相關(guān)性?;蛘?,可以使用協(xié)方差矩陣的基于切線(xiàn)的重新參數(shù)化來(lái)獲得與協(xié)方差矩陣的黎曼(Riemannian)流形有關(guān)的函數(shù)連通矩陣。這些連接系數(shù)可以提高比較患病人群和患病人群的靈敏度。還可以通過(guò)將原始時(shí)間序列分解成多個(gè)頻率子帶并將這些子帶內(nèi)的信號(hào)分別相關(guān)來(lái)定義特定頻率的連接強(qiáng)度。一些研究偏離了這個(gè)常規(guī)。在圖論分析中,通常將分割的大腦區(qū)域表示為圖節(jié)點(diǎn),將節(jié)點(diǎn)之間的功能連通性表示為邊權(quán)重。這種基于圖的功能連通性表示,即人類(lèi)“連接體”,已被用來(lái)推斷大腦網(wǎng)絡(luò)的各種拓?fù)涮卣鳎?/span>如模塊化、聚類(lèi)、小世界性等。一些判別模型利用這些基于圖形的測(cè)量方法進(jìn)行個(gè)體水平的預(yù)測(cè),盡管它們更常用于比較群體。盡管數(shù)量有限,一些研究也探索了RSFC以外的磁共振成像特征(圖9)。低頻波動(dòng)的幅度(ALFF)和rs-fMRI信號(hào)的局部同步或區(qū)域同質(zhì)性(ReHo)是研究自發(fā)大腦活動(dòng)的兩種替代方法,這兩種方法已顯示出辨別能力。最近,一些研究也開(kāi)始探索監(jiān)督模型中動(dòng)態(tài)功能函數(shù)的預(yù)測(cè)能力。圖9.基于rs-fMRI的監(jiān)督學(xué)習(xí)設(shè)計(jì)選擇總結(jié) 4.2特征選擇特征選擇的目標(biāo)是從數(shù)據(jù)中去除噪聲、冗余或不相關(guān)的特征,同時(shí)最小化信息損失。對(duì)于訓(xùn)練監(jiān)督學(xué)習(xí)算法來(lái)說(shuō),特征選擇通常是一個(gè)有利的預(yù)處理步驟,尤其是在小樣本情況下。如果沒(méi)有足夠的正則化,大量的特征會(huì)導(dǎo)致泛化能力的損失。因此,選擇相關(guān)性最高的特征子集有助于構(gòu)建更好的可推廣模型,同時(shí)降低計(jì)算復(fù)雜度。特征選擇可以有監(jiān)督或無(wú)監(jiān)督的方式進(jìn)行。監(jiān)督或半監(jiān)督特征選擇技術(shù)根據(jù)特征區(qū)分不同類(lèi)別樣本的能力來(lái)選擇特征子集。因此,這些方法依賴(lài)于類(lèi)標(biāo)簽,并可以進(jìn)一步分為濾波器、包裝器或嵌入類(lèi)型模型(filter, wrapper or embedded type models)。濾波器模型首先基于統(tǒng)計(jì)度量(例如。t-test),然后選擇排名靠前的特征。包裝器模型基于它們的預(yù)測(cè)準(zhǔn)確性來(lái)選擇特征子集,因此需要預(yù)定的分類(lèi)算法。因此,包裝模型表現(xiàn)更好,因?yàn)樗鼈冊(cè)谔卣鬟x擇期間考慮了預(yù)測(cè)精度估計(jì)。然而,由于重復(fù)學(xué)習(xí)和交叉驗(yàn)證,這些模型在計(jì)算上是禁止的。嵌入式模型通過(guò)將特征選擇集成到學(xué)習(xí)算法中,結(jié)合了兩者的優(yōu)點(diǎn)。像LASSO這樣的回歸模型屬于這一類(lèi),因?yàn)樗鼈兺ㄟ^(guò)鼓勵(lì)稀疏性來(lái)隱含地選擇特征。這些特征選擇方法在唐等人的詳細(xì)綜述中進(jìn)行了深入討論。特征選擇的另一種方法是輸入降維。像主成分分析或LLE這樣的方法屬于無(wú)監(jiān)督特征選擇技術(shù)的范疇,并且在一些研究中已經(jīng)被用于將特征集減少到可管理的大小。然而,有論文指出的,這些根本不能保證提高分類(lèi)性能,因?yàn)樗鼈儗?duì)類(lèi)標(biāo)簽不敏感。此外,特征選擇是否必要也取決于下游學(xué)習(xí)算法。一般來(lái)說(shuō),支持向量機(jī)可以很好地處理高維數(shù)據(jù),因?yàn)樗请[式正則化的。在支持向量機(jī)的背景下,Vapnik和Chapelle已經(jīng)表明,泛化誤差的上限與特征的數(shù)量無(wú)關(guān)。一般來(lái)說(shuō),正則化模型能夠處理大型特征集。缺點(diǎn)是這些模型需要交叉驗(yàn)證來(lái)調(diào)整超參數(shù),如正則化懲罰的權(quán)重。這可能會(huì)減少可用于訓(xùn)練和/或獨(dú)立測(cè)試的有效樣本量。在某些情況下,利用領(lǐng)域知識(shí)來(lái)指導(dǎo)特征選擇可能是有益的。例如,如果基于先前的研究,已知某些解剖區(qū)域已經(jīng)改變了疾病中的功能連接性,則使用該先前知識(shí)來(lái)構(gòu)建聚焦特征集可能是有利的。4.3 方法大多數(shù)應(yīng)用于rs-fMRI的監(jiān)督學(xué)習(xí)方法是基于判別的,即他們?cè)跊](méi)有任何關(guān)于生成過(guò)程的預(yù)先假設(shè)的情況下區(qū)分不同的類(lèi)。重點(diǎn)是正確估計(jì)感興趣的類(lèi)別之間的界限。相同判別函數(shù)的學(xué)習(xí)算法(例如:線(xiàn)性)可以基于不同的目標(biāo)函數(shù),產(chǎn)生不同的模型。作者在下面描述了常見(jiàn)的模型(圖10)。圖10:用于rs-fMRI分析的監(jiān)督學(xué)習(xí)方法的分類(lèi)決策樹(shù)基于輸入特征空間X中的一系列分割來(lái)預(yù)測(cè)輸出Y。該樹(shù)是一個(gè)有向無(wú)環(huán)圖,其節(jié)點(diǎn)代表決策點(diǎn),邊代表其結(jié)果。當(dāng)?shù)竭_(dá)沒(méi)有子節(jié)點(diǎn)(葉節(jié)點(diǎn))的節(jié)點(diǎn)時(shí),該樹(shù)的遍歷結(jié)合起來(lái)導(dǎo)致目標(biāo)結(jié)果預(yù)測(cè)。決策樹(shù)通常以自上而下的貪婪方式構(gòu)建,通過(guò)優(yōu)化量化預(yù)測(cè)和基本事實(shí)之間一致性的指標(biāo),在每一步拆分節(jié)點(diǎn)。例如,在分類(lèi)中,用于量化這種一致性的常用信息論度量是信息增益,即知道X后Y的熵的減少。數(shù)學(xué)上,這表示為其中,H表示香農(nóng)熵。基于這個(gè)度量,第一次分割將使用給出最大信息增益的屬性X。決策樹(shù)可以提供可解釋性,但通常以降低準(zhǔn)確性為代價(jià)。決策樹(shù)的集合,如隨機(jī)森林或增強(qiáng)樹(shù),因此在大多數(shù)應(yīng)用中是更受歡迎的選擇,因?yàn)樗鼈儺a(chǎn)生更好的預(yù)測(cè)性能。4.3.4深層神經(jīng)網(wǎng)絡(luò)一個(gè)理想的機(jī)器學(xué)習(xí)系統(tǒng)應(yīng)該是高度自動(dòng)化的,在特征提取方面有有限的手工制作,并且對(duì)數(shù)據(jù)和標(biāo)簽之間的映射性質(zhì)有最小的假設(shè)。該系統(tǒng)應(yīng)該能夠從觀(guān)察到的標(biāo)記數(shù)據(jù)中機(jī)械地學(xué)習(xí)對(duì)預(yù)測(cè)有用的模式。神經(jīng)網(wǎng)絡(luò)是非常有前途的自動(dòng)化學(xué)習(xí)方法。這源于它們?cè)诮o定足夠的標(biāo)記數(shù)據(jù)的情況下逼近任意復(fù)雜函數(shù)的能力。基于深度學(xué)習(xí)的模型或神經(jīng)網(wǎng)絡(luò)定義了一個(gè)映射Y = f(X;θ)并優(yōu)化參數(shù)θ,以產(chǎn)生最佳的函數(shù)逼近。函數(shù)f(?)通常由簡(jiǎn)單的非線(xiàn)性函數(shù)串聯(lián)而成,通常稱(chēng)為層。一個(gè)廣泛使用的層是一個(gè)完全連接的層,它線(xiàn)性組合輸入變量,并應(yīng)用簡(jiǎn)單的元素非線(xiàn)性函數(shù),如sigmoid。層數(shù)決定網(wǎng)絡(luò)的深度,并控制模型的復(fù)雜性。各層的權(quán)重和偏差通過(guò)基于梯度下降的方法進(jìn)行優(yōu)化,以最小化量化經(jīng)驗(yàn)風(fēng)險(xiǎn)的目標(biāo)函數(shù)。傳統(tǒng)上,神經(jīng)網(wǎng)絡(luò)算法的使用受到限制,因?yàn)樯窠?jīng)成像是一個(gè)數(shù)據(jù)稀缺的領(lǐng)域,使得很難學(xué)習(xí)輸入和預(yù)測(cè)變量之間的可靠映射。然而,隨著數(shù)據(jù)共享和大規(guī)模神經(jīng)影像數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)放發(fā)布,神經(jīng)網(wǎng)絡(luò)最近在rsfMRI社區(qū)中被用于監(jiān)督預(yù)測(cè)任務(wù)。具有完全連接的密集層的神經(jīng)網(wǎng)絡(luò)已經(jīng)被采用來(lái)學(xué)習(xí)從連接特征到疾病標(biāo)簽的任意映射。最近,更先進(jìn)的具有局部感受野的神經(jīng)網(wǎng)絡(luò)模型,如卷積神經(jīng)網(wǎng)絡(luò)(CNNs),已經(jīng)使用rs-fMRI數(shù)據(jù)顯示出有希望的分類(lèi)精度。神經(jīng)網(wǎng)絡(luò)用一組可學(xué)習(xí)的濾波器取代了卷積的全連通運(yùn)算。這種方法的成功源于它能夠利用遙感-功能磁共振成像的全分辨率3D空間結(jié)構(gòu),而不必學(xué)習(xí)太多的模型參數(shù),這要?dú)w功于CNN中的權(quán)重共享。4.3.5.1 不同方法的優(yōu)缺點(diǎn)。所有算法都有自己的優(yōu)缺點(diǎn),方法的選擇應(yīng)該由幾個(gè)因素決定,如預(yù)測(cè)任務(wù)、樣本大小和輸入特征的性質(zhì)。用于神經(jīng)成像應(yīng)用的常見(jiàn)監(jiān)督學(xué)習(xí)算法(如正則化線(xiàn)性模型或SVMs)中的訓(xùn)練目標(biāo)通常是兩個(gè)項(xiàng)的組合:數(shù)據(jù)丟失項(xiàng),它是經(jīng)驗(yàn)風(fēng)險(xiǎn)或訓(xùn)練誤差的度量,以及先驗(yàn)的正則化懲罰,它有助于打擊學(xué)習(xí)過(guò)程中的過(guò)度擬合(泛化誤差)。懲罰標(biāo)準(zhǔn)可能很關(guān)鍵,并且經(jīng)常受到作者對(duì)數(shù)據(jù)的先驗(yàn)知識(shí)的限制。L1懲罰鼓勵(lì)權(quán)重的稀疏性,而L2懲罰可以允許內(nèi)核化,從而實(shí)現(xiàn)非線(xiàn)性決策函數(shù)。L2懲罰導(dǎo)致密集的先驗(yàn),并且在學(xué)習(xí)所有特征都有助于預(yù)測(cè)模型的問(wèn)題中是有用的。當(dāng)先驗(yàn)信念表明只有一部分特征有助于預(yù)測(cè)時(shí),L1懲罰是有用的。一些回歸模型,例如Elastic-Net,采用這兩種懲罰的線(xiàn)性組合,以額外的超參數(shù)為代價(jià)來(lái)調(diào)整兩者之間的權(quán)衡。算法的選擇也受最終目標(biāo)的影響。當(dāng)需要可解釋性而不是最佳性能時(shí),像決策樹(shù)或LASSO這樣的模型通常是首選的,而如果目標(biāo)是最大化性能,像支持向量機(jī)、隨機(jī)森林或神經(jīng)網(wǎng)絡(luò)這樣的高復(fù)雜性模型是必不可少的。4.3.5.2對(duì)樣本大小的評(píng)論。一個(gè)重要的問(wèn)題出現(xiàn)了:訓(xùn)練監(jiān)督學(xué)習(xí)模型的合適樣本量是多少?不出所料,研究表明,學(xué)習(xí)所需的樣本大小取決于模型的復(fù)雜性。強(qiáng)大的非線(xiàn)性算法通常需要更多的訓(xùn)練樣本才能有效。一般來(lái)說(shuō),人們還會(huì)期望數(shù)據(jù)中的特征越多,就需要越多的訓(xùn)練樣本來(lái)表征它們的分布。因此,用于訓(xùn)練最大似然算法的最小訓(xùn)練規(guī)模通常是輸入維數(shù)、所選模型的復(fù)雜性、數(shù)據(jù)質(zhì)量、數(shù)據(jù)異質(zhì)性、類(lèi)的可分性等的復(fù)雜函數(shù)。鑒于樣本量對(duì)分類(lèi)性能的顯著影響,理解這種關(guān)系的本質(zhì)是非常必要的。使用學(xué)習(xí)曲線(xiàn)回答這個(gè)問(wèn)題有重要的持續(xù)研究。這些曲線(xiàn)模擬樣本量和泛化誤差之間的關(guān)系,并可用于預(yù)測(cè)訓(xùn)練特定分類(lèi)器所需的樣本量。幾項(xiàng)研究表明,學(xué)習(xí)曲線(xiàn)可以用逆冪律函數(shù)形式很好地表征,用E(n)β,其中E表示誤差,n表示樣本大小。除了經(jīng)驗(yàn)證明,許多研究也提供了逆冪律模型的理論動(dòng)機(jī)?;谙惹暗姆诸?lèi)研究,對(duì)于給定的應(yīng)用領(lǐng)域,根據(jù)經(jīng)驗(yàn)擬合學(xué)習(xí)曲線(xiàn)的參數(shù)。對(duì)于傳統(tǒng)算法,已知學(xué)習(xí)曲線(xiàn)是平穩(wěn)的,即超過(guò)一定的樣本量,性能的提高是微不足道的。深度學(xué)習(xí)方法的一個(gè)顯著優(yōu)勢(shì)是,如果有足夠的容量,它們可以在更多數(shù)據(jù)的情況下非常好地?cái)U(kuò)展。鑒于最近對(duì)使用rsfMRI進(jìn)行單個(gè)受試者預(yù)測(cè)的興趣激增,估計(jì)rs-fMRI數(shù)據(jù)分類(lèi)的學(xué)習(xí)曲線(xiàn)對(duì)于理解該領(lǐng)域的樣本量要求可能是非常寶貴的。另一個(gè)關(guān)鍵問(wèn)題涉及估計(jì)預(yù)測(cè)分?jǐn)?shù)的穩(wěn)健性。實(shí)證研究表明,神經(jīng)影像學(xué)研究中典型的小樣本量會(huì)導(dǎo)致預(yù)測(cè)精度的大誤差。例如,在樣本大小為100的情況下,估計(jì)二進(jìn)制分類(lèi)任務(wù)的預(yù)測(cè)精度誤差接近10%。在1000個(gè)樣本的情況下,這個(gè)誤差降低到3%。大的置信界限可能會(huì)使基于少量樣本的研究結(jié)論無(wú)效。克服樣本量不足限制的一種可能策略是以半監(jiān)督方式利用未標(biāo)記數(shù)據(jù),以提高監(jiān)督學(xué)習(xí)算法的有效性。遷移學(xué)習(xí)技術(shù)是在低數(shù)據(jù)率下提高分類(lèi)性能的另一種有前途的方法。這些方法利用在大型數(shù)據(jù)集或輔助任務(wù)上訓(xùn)練的神經(jīng)網(wǎng)絡(luò),通過(guò)將它們微調(diào)到目標(biāo)數(shù)據(jù)集或分類(lèi)任務(wù)。在rs-fMRI分析領(lǐng)域,這些是相對(duì)未被探索的方向,具有緩解樣本量限制的巨大潛力。4.3.5.3對(duì)模型評(píng)估的評(píng)論。交叉驗(yàn)證是一種模型評(píng)估技術(shù),用于估計(jì)預(yù)測(cè)模型的泛化誤差。一個(gè)簡(jiǎn)單的交叉驗(yàn)證策略是保持,其中數(shù)據(jù)被隨機(jī)分成一個(gè)訓(xùn)練和測(cè)試集,并且在這個(gè)單次運(yùn)行中的測(cè)試分?jǐn)?shù)被用作樣本外準(zhǔn)確性的估計(jì)。在大多數(shù)神經(jīng)影像學(xué)研究中,由于樣本量有限,K-fold是主要的交叉驗(yàn)證選擇,因?yàn)樗ㄟ^(guò)重復(fù)保持來(lái)利用所有數(shù)據(jù)點(diǎn)進(jìn)行訓(xùn)練和驗(yàn)證,產(chǎn)生的誤差估計(jì)比經(jīng)典保持要小得多。它首先將數(shù)據(jù)劃分為K個(gè)不重疊的子集,D = {S1,…,SK}。對(duì)于每個(gè)折疊i在{1,…,K}中,模型在D Si上訓(xùn)練,在Si上評(píng)價(jià)。然后使用所有折疊的平均精度來(lái)估計(jì)模型性能。而K可以是任何數(shù)值,常見(jiàn)的選擇有5或10.當(dāng)K等于訓(xùn)練集中的樣本數(shù)時(shí),重采樣過(guò)程被稱(chēng)為留一交叉驗(yàn)證。當(dāng)樣本量較低(通常小于100)時(shí),這可以用于計(jì)算成本較低的模型。4.4.監(jiān)督學(xué)習(xí)在磁共振功能磁共振成像中的應(yīng)用利用靜息態(tài)相關(guān)性進(jìn)行監(jiān)督預(yù)測(cè)任務(wù)的研究正以前所未有的規(guī)模發(fā)展。下面作者描述一些在rs-fMRI中有監(jiān)督機(jī)器學(xué)習(xí)的有趣應(yīng)用。機(jī)器學(xué)習(xí)方法在研究正在發(fā)展的連接體方面顯示出希望。在早期有影響的工作中,Dosenbach等人證明了在青少年和年輕成人中使用RSFC預(yù)測(cè)按年齡測(cè)量的大腦成熟的可行性。利用SVM,他們開(kāi)發(fā)了一個(gè)基于預(yù)測(cè)大腦年齡的功能成熟指數(shù)。后來(lái)的研究表明,即使在分布于人類(lèi)一生的不同群體中,大腦成熟度也是可以合理預(yù)測(cè)的。這些工作將磁共振功能磁共振成像作為預(yù)測(cè)健康神經(jīng)發(fā)育的有價(jià)值的工具,并揭示了RSFC與年齡相關(guān)的新動(dòng)態(tài),如感覺(jué)運(yùn)動(dòng)區(qū)功能性傳導(dǎo)通路的主要變化,或隨年齡增長(zhǎng)而日益分布的功能結(jié)構(gòu)。除了表征伴隨自然衰老的RSFC變化,機(jī)器學(xué)習(xí)也被用來(lái)識(shí)別非典型的神經(jīng)發(fā)育。機(jī)器學(xué)習(xí)已被廣泛用于研究rs-fMRI數(shù)據(jù)在各種神經(jīng)和精神疾病中的診斷價(jià)值。神經(jīng)退行性疾病,如阿爾茨海默病,其前驅(qū)狀態(tài)輕度認(rèn)知障礙,帕金森病和肌萎縮性側(cè)索硬化(ALS),已被機(jī)器學(xué)習(xí)模型使用基于功能連接性的生物標(biāo)記物以有希望的準(zhǔn)確性進(jìn)行分類(lèi)。阿爾茨海默氏癥或多發(fā)性硬化癥等神經(jīng)疾病的腦萎縮模式早在行為癥狀出現(xiàn)之前就出現(xiàn)了。因此,源于結(jié)構(gòu)或功能異常的基于神經(jīng)影像學(xué)的生物標(biāo)志物有利于早期診斷和隨后的干預(yù)以減緩?fù)诵行宰冞^(guò)程。精神疾病的生物學(xué)基礎(chǔ)一直難以捉摸,這些疾病的診斷目前完全由行為評(píng)估驅(qū)動(dòng)。磁共振成像已經(jīng)成為一種強(qiáng)有力的方法,可以獲得基于成像的生物標(biāo)志物,用于對(duì)精神疾病進(jìn)行診斷性預(yù)測(cè)。使用RSFC的監(jiān)督學(xué)習(xí)算法在對(duì)各種精神疾病的癥狀嚴(yán)重性進(jìn)行分類(lèi)或預(yù)測(cè)方面顯示出有希望的結(jié)果,包括精神分裂癥,抑郁癥,自閉癥譜系障礙,注意缺陷多動(dòng)障礙,社交焦慮障礙,創(chuàng)傷后應(yīng)激障礙和強(qiáng)迫癥。作為這些研究的結(jié)果,針對(duì)這些疾病出現(xiàn)了幾個(gè)新的網(wǎng)絡(luò)破壞假說(shuō)。這些預(yù)測(cè)模型大多基于標(biāo)準(zhǔn)的基于核的支持向量機(jī),并依賴(lài)感興趣區(qū)域?qū)χg的模糊聚類(lèi)作為判別特征。功能連接也可以用來(lái)預(yù)測(cè)認(rèn)知和行為的個(gè)體差異。與捕捉單一認(rèn)知維度的任務(wù)功能磁共振成像研究相比,由于其不受控制的性質(zhì),靜息狀態(tài)包含了廣泛的認(rèn)知狀態(tài)。這使得它成為一種豐富的方式來(lái)捕獲跨多個(gè)行為域的個(gè)體間可變性。在健康和病理人群中,基于RSFC的生物標(biāo)記物顯示,最大似然模型可以預(yù)測(cè)流體智力,持續(xù)注意力,記憶表現(xiàn),語(yǔ)言得分。最近,這些模型的效用也被證明擴(kuò)展到了人格特征,如神經(jīng)質(zhì)、外向性、宜人性和開(kāi)放性。行為表現(xiàn)的預(yù)測(cè)在臨床環(huán)境中有助于理解病理學(xué)中的RSFC破壞與認(rèn)知功能受損之間的關(guān)系。Meskaldji等人使用回歸模型從不同的連接性測(cè)量預(yù)測(cè)輕度認(rèn)知障礙患者的記憶障礙。西格爾等人通過(guò)訓(xùn)練嶺回歸模型將RSFC和結(jié)構(gòu)與多個(gè)領(lǐng)域(記憶、語(yǔ)言、注意力、視覺(jué)和運(yùn)動(dòng)任務(wù))的表現(xiàn)聯(lián)系起來(lái),評(píng)估了中風(fēng)患者網(wǎng)絡(luò)中斷的行為意義。其中,記憶缺陷由RSFC更好地預(yù)測(cè),而結(jié)構(gòu)對(duì)于預(yù)測(cè)視覺(jué)和運(yùn)動(dòng)障礙更重要。這項(xiàng)研究強(qiáng)調(diào)了rs-fMRI如何在研究大腦-行為關(guān)系中補(bǔ)充結(jié)構(gòu)信息。一些研究使用機(jī)器學(xué)習(xí)來(lái)預(yù)測(cè)rs-fMRI掃描期間的警戒水平。由于靜息狀態(tài)研究不需要任務(wù)處理,受試者容易在清醒和睡眠之間徘徊。rs-fMRI期間警戒狀態(tài)的分類(lèi)對(duì)于消除警戒混淆和污染很重要。在皮質(zhì)-皮質(zhì)RSFC上訓(xùn)練的SVM分類(lèi)器已經(jīng)被證明能夠可靠地檢測(cè)到睡眠呼吸暫停綜合征內(nèi)的睡眠周期。塔利亞祖奇和勞夫斯發(fā)現(xiàn),在實(shí)驗(yàn)組的三分之一的受試者中,早在進(jìn)入掃描儀3分鐘時(shí),就出現(xiàn)了失眠。這些發(fā)現(xiàn)很有趣:雖然假設(shè)靜止?fàn)顟B(tài)可以捕捉清醒狀態(tài),但即使掃描持續(xù)時(shí)間很短,這也不完全正確。這些研究的效用不應(yīng)僅限于分類(lèi)。通過(guò)適當(dāng)?shù)慕忉尯涂梢暬夹g(shù),機(jī)器學(xué)習(xí)可以在人們進(jìn)入睡眠狀態(tài)時(shí)對(duì)功能組織的重新配置提供新的啟示。預(yù)測(cè)不同睡眠條件后認(rèn)知反應(yīng)的個(gè)體差異(例如睡眠剝奪)使用機(jī)器學(xué)習(xí)分析rs-fMRI是另一個(gè)有趣的研究方向。人們對(duì)研究睡眠剝奪后的RSFC變化很感興趣。雖然統(tǒng)計(jì)分析已經(jīng)闡明了睡眠剝奪的功能重組特征,但仍有許多關(guān)于易受睡眠剝奪影響的個(gè)體間差異相關(guān)的功能性認(rèn)知模式有待理解。Yeo等人在休息良好的狀態(tài)下,根據(jù)功能連接性數(shù)據(jù)訓(xùn)練了一個(gè)SVM分類(lèi)器,以區(qū)分睡眠剝奪后容易出現(xiàn)警覺(jué)性下降的受試者和更有彈性的受試者,并揭示了各組之間的重要網(wǎng)絡(luò)差異。理解基因?qū)Υ竽X結(jié)構(gòu)和功能的影響一直是神經(jīng)科學(xué)的長(zhǎng)期目標(biāo)。在最近的一項(xiàng)研究中,葛等人。采用傳統(tǒng)的統(tǒng)計(jì)框架來(lái)量化全腦血流動(dòng)力學(xué)估計(jì)值的遺傳度。還在機(jī)器學(xué)習(xí)框架內(nèi)對(duì)RSFC的遺傳和環(huán)境基礎(chǔ)進(jìn)行了調(diào)查。米蘭達(dá)-多明戈斯等人在單個(gè)FC簽名上訓(xùn)練SVM分類(lèi)器,以區(qū)分同胞和雙胞胎對(duì)與不相關(guān)的受試者對(duì)。這項(xiàng)研究揭示了幾個(gè)有趣的發(fā)現(xiàn)。從靜息態(tài)功能磁共振成像成功預(yù)測(cè)家族關(guān)系的能力表明,功能連接的各個(gè)方面是由遺傳或獨(dú)特的環(huán)境因素決定的。事實(shí)上,在年輕的成年人中,預(yù)測(cè)仍然是準(zhǔn)確的,這表明這些影響是通過(guò)發(fā)展來(lái)維持的。此外,與非雙胞胎兄弟姐妹相比,預(yù)測(cè)雙胞胎的準(zhǔn)確性更高,這意味著遺傳(而不是環(huán)境)可能是更強(qiáng)的預(yù)測(cè)力。機(jī)器學(xué)習(xí)也可以用來(lái)詢(xún)問(wèn)rs-fMRI和其他模式之間的對(duì)應(yīng)關(guān)系。最密切相關(guān)的模態(tài)是任務(wù)-功能磁共振成像。Tavor等人經(jīng)過(guò)訓(xùn)練的多元回歸模型表明,靜息狀態(tài)連接可以預(yù)測(cè)大腦中幾個(gè)行為領(lǐng)域的任務(wù)誘發(fā)反應(yīng)。rs-fMRI是一種無(wú)任務(wù)機(jī)制,它能夠預(yù)測(cè)多項(xiàng)任務(wù)引發(fā)的激活模式,這表明靜息狀態(tài)可以捕捉基于任務(wù)的fMRI所反映的豐富認(rèn)知狀態(tài)。這些回歸模型的性能被證明可以推廣到病理人群,表明這種方法在無(wú)法執(zhí)行某些任務(wù)的人群中繪制功能區(qū)的臨床應(yīng)用。 調(diào)查結(jié)構(gòu)連接如何塑造不同大腦區(qū)域之間的功能聯(lián)系一直是大量研究的焦點(diǎn)。雖然神經(jīng)計(jì)算模型有望實(shí)現(xiàn)這一目標(biāo),但機(jī)器學(xué)習(xí)模型特別適合捕捉結(jié)構(gòu)-功能關(guān)系中的個(gè)體間差異。Deligianni等人提出了一個(gè)結(jié)構(gòu)輸出多元回歸模型,從DWI導(dǎo)出的結(jié)構(gòu)連接性預(yù)測(cè)靜息態(tài)功能連接性,并通過(guò)交叉驗(yàn)證證明了該技術(shù)的有效性。Venkataraman等人引入了一種新的概率模型,以檢查使用DWI追蹤成像和RSFC測(cè)量的解剖連接性之間的關(guān)系。他們的公式假設(shè)這兩種模式是從一個(gè)共同的連接模板生成的。估計(jì)的潛在連接性估計(jì)被證明可以區(qū)分對(duì)照人群和精神分裂癥人群,從而表明聯(lián)合建模在臨床環(huán)境中也是有用的(表4)。5. Discussion5.1給機(jī)器學(xué)習(xí)從業(yè)者的實(shí)用建議任何機(jī)器學(xué)習(xí)應(yīng)用程序都需要以下條件:(a)反映測(cè)量值和其他歸納偏差之間假定關(guān)系的模型,(b)量化模型捕捉作者數(shù)據(jù)的能力的成本函數(shù),以及(c)最小化成本的適當(dāng)優(yōu)化算法。機(jī)器學(xué)習(xí)在rs-fMRI中的成功應(yīng)用需要對(duì)這些算法如何工作、失敗時(shí)意味著什么以及最重要的是如何為給定的任務(wù)或假設(shè)選擇算法有一個(gè)整體的觀(guān)點(diǎn)。有三個(gè)關(guān)鍵因素可以決定這一選擇:1. 研究的問(wèn)題是什么?作者之前的信念是什么?無(wú)監(jiān)督學(xué)習(xí)處理關(guān)于數(shù)據(jù)生成過(guò)程的問(wèn)題。例如,聚類(lèi)和分解方法都被廣泛用于理清rs-fMRI數(shù)據(jù)的潛在因果來(lái)源。然而,它們代表了不同的先驗(yàn)信念,并且經(jīng)?;卮鸩煌难芯繂?wèn)題。例如,在發(fā)現(xiàn)RSNs的背景下,獨(dú)立成分分析假設(shè)潛在成分是獨(dú)立的,并尋求恢復(fù)激活源的空間位點(diǎn)。這種分解進(jìn)一步實(shí)現(xiàn)了功能活動(dòng)與噪聲源的分離。另一方面,聚類(lèi)通常假設(shè)每個(gè)空間位置/區(qū)域的激活可以用一組集群中的一個(gè)底層組件來(lái)解釋。因?yàn)檫@種方法導(dǎo)致不相交的功能網(wǎng)絡(luò),聚類(lèi)是學(xué)習(xí)空間連續(xù)全腦分組的主要方法。當(dāng)目標(biāo)是做出預(yù)測(cè)時(shí),監(jiān)督學(xué)習(xí)算法是通常的選擇。監(jiān)督模型的選擇再次取決于研究問(wèn)題:目標(biāo)是理解標(biāo)簽和特征之間的關(guān)系還是構(gòu)建診斷工具?可解釋性是前者應(yīng)用的關(guān)鍵,而最高的準(zhǔn)確性可以解釋為后者的主要目標(biāo)。因此,必須根據(jù)這一最終目標(biāo)來(lái)選擇模型的復(fù)雜性。作者建議這些目標(biāo)在模型開(kāi)發(fā)之前被很好地定義。2. 需要多少數(shù)據(jù)?評(píng)估數(shù)據(jù)量以及獲取更多數(shù)據(jù)是否可行非常重要。樣本大小可以限制模型的復(fù)雜性。需要更多的訓(xùn)練示例來(lái)捕捉要素和標(biāo)簽之間的非線(xiàn)性關(guān)系,而不是線(xiàn)性關(guān)系。數(shù)據(jù)保真度和正則化也必須根據(jù)樣本大小進(jìn)行權(quán)衡。在小樣本情況下,正則化變得更加關(guān)鍵,因?yàn)槟P透赡苓^(guò)度依賴(lài)訓(xùn)練樣本。3.計(jì)算預(yù)算是多少?有時(shí),計(jì)算預(yù)算可能是限制性的。例如,某些算法,如深度神經(jīng)網(wǎng)絡(luò),有很高的計(jì)算需求,可用資源可能無(wú)法支持。此外,如果特征的數(shù)量非常大,訓(xùn)練即使是低復(fù)雜度的模型也會(huì)很耗時(shí)。在這種情況下,運(yùn)行時(shí)復(fù)雜度較低的模型可以?xún)?yōu)先考慮,尤其是對(duì)于早期研究。因此,在選擇合適的模型時(shí),必須確定時(shí)間、計(jì)算預(yù)算或空間限制。5.2限制和機(jī)會(huì)許多最先進(jìn)的rs-fMRI分析技術(shù)植根于機(jī)器學(xué)習(xí)。無(wú)監(jiān)督和有監(jiān)督的學(xué)習(xí)方法都極大地?cái)U(kuò)展了rs-fMRI的應(yīng)用領(lǐng)域。隨著神經(jīng)影像數(shù)據(jù)數(shù)據(jù)的規(guī)?;蛯W(xué)習(xí)算法的進(jìn)步,預(yù)計(jì)未來(lái)將產(chǎn)生更大的影響。盡管機(jī)器學(xué)習(xí)取得了實(shí)際的成功,但理解其目前在應(yīng)用于功能磁共振成像時(shí)遇到的挑戰(zhàn)是很重要的。作者在下面概述了一些重要的限制和未探索的機(jī)會(huì)。與無(wú)監(jiān)督學(xué)習(xí)方法相關(guān)的最大挑戰(zhàn)之一是缺乏對(duì)應(yīng)評(píng)估的基本事實(shí)(即金標(biāo)準(zhǔn))。沒(méi)有先驗(yàn)的大腦通用功能圖來(lái)作為分組方案之間比較的基礎(chǔ)。此外,全腦分組通常以不同的功能組織規(guī)模來(lái)定義,從幾個(gè)大規(guī)模的包裹到數(shù)百個(gè)區(qū)域,這使得比較更具挑戰(zhàn)性。盡管已經(jīng)開(kāi)發(fā)了幾個(gè)評(píng)估標(biāo)準(zhǔn)來(lái)解釋這種可變性,但是沒(méi)有一個(gè)單一的學(xué)習(xí)算法在所有方面都表現(xiàn)出始終如一的優(yōu)勢(shì)。由于各種方法之間的權(quán)衡,選擇哪種分組作為網(wǎng)絡(luò)分析的參考在很大程度上是主觀(guān)的。探索網(wǎng)絡(luò)動(dòng)態(tài)的無(wú)監(jiān)督學(xué)習(xí)方法同樣容易產(chǎn)生主觀(guān)性。通過(guò)離散的精神狀態(tài)來(lái)描述動(dòng)態(tài)的功能連接是困難的,主要是因?yàn)榫駹顟B(tài)可能是無(wú)限的(infinite)。雖然dFC狀態(tài)被認(rèn)為反映了不同的認(rèn)知過(guò)程,但很難獲得不同狀態(tài)的行為對(duì)應(yīng),因?yàn)殪o息狀態(tài)不是外部探測(cè)的。這又一次使解釋變得困難,并容易產(chǎn)生主觀(guān)偏見(jiàn)。這個(gè)方向的機(jī)器學(xué)習(xí)方法到目前為止依賴(lài)于聚類(lèi)統(tǒng)計(jì)來(lái)固定FC狀態(tài)的數(shù)量。非參數(shù)模型(例如infinite hmm)提供了一個(gè)未經(jīng)探索的、有吸引力的框架,因?yàn)樗鼈兏鶕?jù)底層數(shù)據(jù)的復(fù)雜性自適應(yīng)地確定狀態(tài)的數(shù)量。使用rs-fMRI進(jìn)行單個(gè)受試者預(yù)測(cè)的一個(gè)重大挑戰(zhàn)是,rs-fMRI特征可以用多種方式描述。沒(méi)有公認(rèn)的時(shí)間序列提取黃金標(biāo)準(zhǔn)圖譜,也沒(méi)有關(guān)于最佳連通性度量的共識(shí)。此外,即使是功能磁共振成像預(yù)處理策略也可能有很大差異。探索這個(gè)空間很麻煩,尤其是對(duì)于像神經(jīng)網(wǎng)絡(luò)這樣訓(xùn)練速度慢的高級(jí)機(jī)器學(xué)習(xí)模型。理想的系統(tǒng)應(yīng)該對(duì)這些選擇保持不變。然而,在rs-fMRI中,這種情況很難出現(xiàn),因?yàn)樵谶@些因素的相關(guān)預(yù)測(cè)性能中已經(jīng)報(bào)告了較大的偏差。在大規(guī)模人群中訓(xùn)練穩(wěn)健預(yù)測(cè)系統(tǒng)的另一個(gè)挑戰(zhàn)來(lái)自于多位點(diǎn)rs-fMRI數(shù)據(jù)的異質(zhì)性。與基于任務(wù)的協(xié)議相比,靜止?fàn)顟B(tài)更容易跨站點(diǎn)標(biāo)準(zhǔn)化,因?yàn)樗灰蕾?lài)于外部刺激。然而,不同站點(diǎn)采集協(xié)議和掃描儀特性的差異仍然是異質(zhì)性的重要來(lái)源。盡管樣本量較大,但多點(diǎn)研究表明,與單點(diǎn)研究相比,預(yù)測(cè)精度幾乎沒(méi)有提高,雖然可以從數(shù)據(jù)中標(biāo)準(zhǔn)化站點(diǎn)外效應(yīng),但在實(shí)踐中需要更先進(jìn)的工具來(lái)減輕這種偏差。通過(guò)監(jiān)督學(xué)習(xí)方法獲得的高診斷準(zhǔn)確性應(yīng)謹(jǐn)慎解讀。幾個(gè)混雜變量會(huì)導(dǎo)致功能連接性估計(jì)的系統(tǒng)偏差。例如,已知頭部運(yùn)動(dòng)會(huì)影響默認(rèn)模式網(wǎng)絡(luò)和額頂葉控制網(wǎng)絡(luò)中的連接模式。此外,運(yùn)動(dòng)輪廓也在感興趣的子組之間系統(tǒng)地變化,例如,患病患者通常比健康對(duì)照者活動(dòng)更多。除了產(chǎn)生虛假的關(guān)聯(lián),這可能會(huì)影響監(jiān)督預(yù)測(cè)研究的可解釋性。獨(dú)立的統(tǒng)計(jì)分析對(duì)于排除混雜變量對(duì)預(yù)測(cè)的影響至關(guān)重要,尤其是當(dāng)這些變量在被研究的組之間有所不同時(shí)。需要進(jìn)行方法創(chuàng)新,以將預(yù)測(cè)精度提高到適合臨床應(yīng)用(clinical translation)的水平。幾個(gè)因素使得跨研究的方法比較乏味。交叉驗(yàn)證是最常用的報(bào)告模型性能的策略。然而,較小的尺寸(在rs-fMRI研究中很常見(jiàn))會(huì)產(chǎn)生較大的誤差條,表明數(shù)據(jù)分割會(huì)顯著影響性能。在基于rs-fMRI數(shù)據(jù)開(kāi)發(fā)預(yù)測(cè)模型時(shí),可推廣性和可解釋性仍應(yīng)是重點(diǎn)。這些是實(shí)現(xiàn)機(jī)器學(xué)習(xí)模型臨床應(yīng)用的關(guān)鍵屬性。不確定性估計(jì)是任何監(jiān)督學(xué)習(xí)應(yīng)用中的另一個(gè)挑戰(zhàn);理想情況下,任何分類(lèi)算法的類(lèi)分類(lèi)都應(yīng)該伴隨著反映預(yù)測(cè)不確定性的額外措施。這對(duì)于臨床診斷尤其重要,因?yàn)榱私鈧€(gè)體預(yù)測(cè)的可靠性非常重要。大多數(shù)現(xiàn)有的研究側(cè)重于對(duì)單一疾病和對(duì)照進(jìn)行分類(lèi)。診斷系統(tǒng)區(qū)分多種精神疾病的能力在臨床環(huán)境中更有用。因此,有必要評(píng)估最大似然模型在鑒別診斷中的有效性。將rs-fMRI與擴(kuò)散加權(quán)磁共振成像等互補(bǔ)模式相結(jié)合,可能會(huì)產(chǎn)生更好的疾病神經(jīng)表型,這是另一個(gè)具有挑戰(zhàn)性但有前途的研究命題。6. 總結(jié)本文中,作者已經(jīng)對(duì)rs-fMRI分析中的機(jī)器學(xué)習(xí)技術(shù)的現(xiàn)狀進(jìn)行了全面回顧。作者已經(jīng)根據(jù)應(yīng)用和技術(shù)分別組織了關(guān)于這個(gè)主題的大量文獻(xiàn),以使來(lái)自神經(jīng)成像和機(jī)器學(xué)習(xí)社區(qū)的研究人員能夠識(shí)別當(dāng)前實(shí)踐中的主流和仍舊存在不足的地方(表5)。從本文的全面閱讀開(kāi)始,你將快速融入rs-fMRI機(jī)器學(xué)習(xí)研究的洪流,并且能夠有效地掌握全貌。(終于寫(xiě)完了,這讓我想起了十幾年前在奧克蘭山谷打了兩天兩夜戰(zhàn)場(chǎng),值一個(gè)轉(zhuǎn)發(fā))
|