【原】機(jī)器學(xué)習(xí)在靜息態(tài)功能磁共振成像中的應(yīng)用

思影科技 2020-11-18

展開(kāi)全文

機(jī)器學(xué)習(xí)技術(shù)在靜息態(tài)功能磁共振成像(rs-fMRI)數(shù)據(jù)分析方面已經(jīng)獲得了突出地位。在這里，作者對(duì)各種非監(jiān)督和有監(jiān)督機(jī)器學(xué)習(xí)在rs-fMRI的應(yīng)用進(jìn)行了總結(jié)。作者在本文中提供了rs-fMRI中機(jī)器學(xué)習(xí)方法的系統(tǒng)分類(lèi)。基于無(wú)監(jiān)督學(xué)習(xí)方法在rs-fMRI中的應(yīng)用，作者根據(jù)它們是否發(fā)現(xiàn)了跨空間、時(shí)間或人群的主要變化模式，確定了三大類(lèi)無(wú)監(jiān)督學(xué)習(xí)方法。下一步，作者回顧了推動(dòng)有監(jiān)督被試水平(subject_level)預(yù)測(cè)成功的算法和有效的rs-fMRI特征表示的方法。其目的是從機(jī)器學(xué)習(xí)應(yīng)用的角度對(duì)rs-fMRI的新興領(lǐng)域進(jìn)行一個(gè)高層次的概述。本文發(fā)表在Magnetic Resonance Imaging雜志。（可添加微信號(hào)siyingyxf或18983979082獲取原文）。

1.介紹

靜息態(tài)功能磁共振成像（rs-fMRI）是一種廣泛應(yīng)用的神經(jīng)影像學(xué)工具，它可以在沒(méi)有任何受控實(shí)驗(yàn)范式的情況下，測(cè)量整個(gè)大腦的神經(jīng)血氧水平依賴(lài)性（BOLD）信號(hào)的自發(fā)波動(dòng)。在他們的開(kāi)創(chuàng)性工作中，Biswal等人即使在沒(méi)有明確任務(wù)的情況下，也發(fā)現(xiàn)初級(jí)感覺(jué)運(yùn)動(dòng)皮質(zhì)和遠(yuǎn)距離的其他功能相關(guān)區(qū)域之間的低頻自發(fā)波動(dòng)也存在時(shí)間一致性，這表明靜息狀態(tài)活動(dòng)具有神經(jīng)學(xué)意義。隨后的幾項(xiàng)研究類(lèi)似地報(bào)告了由一項(xiàng)任務(wù)共同激活的其他區(qū)域集合（如語(yǔ)言、運(yùn)動(dòng)、注意力、聽(tīng)覺(jué)或視覺(jué)處理等），這些區(qū)域在靜息狀態(tài)顯示出相關(guān)的同步波動(dòng)。這些自發(fā)的共同波動(dòng)區(qū)域被稱(chēng)為靜息狀態(tài)網(wǎng)絡(luò)（RSN）或內(nèi)在大腦網(wǎng)絡(luò)。此后，RSN一詞指的是使用rs-fMRI發(fā)現(xiàn)的共享功能的大腦網(wǎng)絡(luò)。

rs-fMRI有著巨大的潛力來(lái)促進(jìn)作者對(duì)大腦功能組織的理解，以及它是如何因損傷或疾病而改變的。該領(lǐng)域的一個(gè)主要重點(diǎn)是對(duì)靜息狀態(tài)功能連通性（RSFC）的分析，它測(cè)量了大腦空間分布區(qū)域之間的BOLD波動(dòng)的統(tǒng)計(jì)依賴(lài)性。在一些神經(jīng)和精神疾病中發(fā)現(xiàn)了RSFC的紊亂，如阿爾茨海默病，自閉癥，抑郁癥、精神分裂癥等。RSFC的動(dòng)力學(xué)在過(guò)去幾年中也得到了相當(dāng)大的關(guān)注，而rs-fMRI的一個(gè)關(guān)鍵挑戰(zhàn)是開(kāi)發(fā)適當(dāng)?shù)墓ぞ邅?lái)捕捉這種RS活動(dòng)的全部程度。rs-fMRI能捕捉到豐富的內(nèi)在心理狀態(tài)或自發(fā)思維，如果有合適的工具，就有可能產(chǎn)生關(guān)于大腦疾病本質(zhì)的新的神經(jīng)科學(xué)見(jiàn)解。

rs-fMRI數(shù)據(jù)的研究具有高度的交叉性，主要受機(jī)器學(xué)習(xí)、信號(hào)處理和圖論等領(lǐng)域的影響。機(jī)器學(xué)習(xí)方法通常以數(shù)據(jù)驅(qū)動(dòng)的方式提供了豐富的rs-fMRI特征。rs-fMRI中的無(wú)監(jiān)督學(xué)習(xí)方法主要集中在了解健康大腦的功能組織及其動(dòng)力學(xué)。例如，矩陣分解或聚類(lèi)等方法可以同時(shí)揭示大腦中的多個(gè)功能網(wǎng)絡(luò)，也可以揭示動(dòng)態(tài)功能連接的潛在結(jié)構(gòu)。

另一方面，監(jiān)督學(xué)習(xí)技術(shù)可以利用RSFC進(jìn)行個(gè)體水平的預(yù)測(cè)。大量的研究致力于使用rs-fMRI對(duì)患者和對(duì)照組進(jìn)行分類(lèi)，或者預(yù)測(cè)疾病預(yù)后(disease prognosis)和指導(dǎo)治療。另一類(lèi)研究探討了個(gè)體在認(rèn)知特征上的差異在多大程度上可以通過(guò)RSFC的差異來(lái)預(yù)測(cè)，產(chǎn)生了有希望的結(jié)果。預(yù)測(cè)方法也可以用來(lái)解決神經(jīng)科學(xué)中感興趣的研究問(wèn)題。例如，RSFC是可遺傳的嗎？這樣的問(wèn)題可以在一個(gè)預(yù)測(cè)框架內(nèi)表述出來(lái)，以檢驗(yàn)新的假設(shè)。

從映射功能網(wǎng)絡(luò)到進(jìn)行個(gè)體水平的預(yù)測(cè)，機(jī)器學(xué)習(xí)在rs-fMRI中的應(yīng)用意義深遠(yuǎn)。本文旨在以簡(jiǎn)明的方式介紹機(jī)器學(xué)習(xí)在從rs-fMRI數(shù)據(jù)中產(chǎn)生開(kāi)創(chuàng)性見(jiàn)解方面所起的作用，并描述機(jī)器學(xué)習(xí)在rs-fMRI中應(yīng)用的發(fā)展。作者將介紹rs-fMRI中機(jī)器學(xué)習(xí)的關(guān)鍵思想和應(yīng)用領(lǐng)域，而不是深入研究機(jī)器學(xué)習(xí)算法本身的精確技術(shù)差別。根據(jù)該領(lǐng)域的最新發(fā)展和潛力，作者討論了當(dāng)前的挑戰(zhàn)和未來(lái)工作的前景。

1.1靜息態(tài)功能磁共振成像:歷史視角

直到21世紀(jì)初，任務(wù)功能磁共振成像（task fMRI）一直是研究大腦不同區(qū)域功能的主要神經(jīng)成像工具，以及它們?nèi)绾螀f(xié)調(diào)以產(chǎn)生認(rèn)知功能的不同心理表征。Biswal等人在已知的皮層網(wǎng)絡(luò)中發(fā)現(xiàn)了相關(guān)的自發(fā)波動(dòng)。大量的后續(xù)研究已經(jīng)證實(shí)了rs-fMRI是探索大腦功能結(jié)構(gòu)的有用工具。在過(guò)去的十年里，采用靜息態(tài)范式的研究規(guī)模空前擴(kuò)大。這些方案比其他基于任務(wù)的實(shí)驗(yàn)簡(jiǎn)單得多，能夠?qū)】荡竽X的功能連接及其在疾病中的破壞提供關(guān)鍵的見(jiàn)解。靜息狀態(tài)也很有吸引力，因?yàn)樗试S多個(gè)部位的協(xié)作，不像任務(wù)功能磁共振成像那樣容易受到局部實(shí)驗(yàn)環(huán)境的干擾。這使得網(wǎng)絡(luò)分析達(dá)到了前所未有的規(guī)模。

傳統(tǒng)上，rs-fMRI研究的重點(diǎn)是通過(guò)基于種子的分析（SBA）來(lái)識(shí)別空間上有區(qū)別但功能上相關(guān)的大腦區(qū)域。該方法先選擇種子體素或感興趣區(qū)域，然后將每個(gè)種子的時(shí)間序列與來(lái)自所有腦體素的時(shí)間序列相關(guān)聯(lián)，生成一系列相關(guān)圖。SBA雖然簡(jiǎn)單且易于解釋?zhuān)捎谄浜艽蟪潭壬先Q于人工種子選擇，并且在其最簡(jiǎn)單的形式下，一次只能顯示一個(gè)特定的功能系統(tǒng)，因此受到限制。

像獨(dú)立成分分析（ICA）這樣的分解方法，在21世紀(jì)初成為種子相關(guān)分析的一種非常有前途的替代方法。其次是其他無(wú)監(jiān)督學(xué)習(xí)技術(shù)，如聚類(lèi)。與基于種子的方法相比，這種方法探索與種子相關(guān)的網(wǎng)絡(luò)體素（如運(yùn)動(dòng)或視覺(jué)功能連接圖），這些基于分解或聚類(lèi)的新的無(wú)模型(model-free)方法同時(shí)在整個(gè)大腦中探索靜息態(tài)網(wǎng)絡(luò)（RSN），用于個(gè)體或群體水平的分析。不管使用何種分析工具，所有的研究基本上都集中在報(bào)告了大腦中多個(gè)穩(wěn)定的靜息態(tài)網(wǎng)絡(luò)，如：初級(jí)感覺(jué)運(yùn)動(dòng)網(wǎng)絡(luò)、初級(jí)視覺(jué)網(wǎng)絡(luò)、額頂葉注意網(wǎng)絡(luò)和研究得很好的默認(rèn)網(wǎng)絡(luò)。默認(rèn)網(wǎng)絡(luò)中的區(qū)域，如后扣帶皮質(zhì)、楔前葉、腹側(cè)和背側(cè)內(nèi)側(cè)前額葉皮質(zhì)，在靜息狀態(tài)下表現(xiàn)出活動(dòng)水平的增加，這表明該網(wǎng)絡(luò)代表了人腦的基本功能或默認(rèn)功能。默認(rèn)網(wǎng)絡(luò)引起了rs-fMRI社區(qū)的極大興趣，因此，一些研究探索了各種神經(jīng)和精神疾?。òㄗ蚤]癥、精神分裂癥和阿爾茨海默氏癥）中大腦默認(rèn)網(wǎng)絡(luò)（DMN）靜息狀態(tài)連接的中斷。

盡管rs-fMRI技術(shù)獲得了廣泛的成功和普及，但靜息狀態(tài)下大腦持續(xù)自發(fā)波動(dòng)的原因仍不清楚。有幾項(xiàng)研究探討了靜息狀態(tài)下的相干起伏是神經(jīng)元起源的，還是僅僅是心臟或呼吸周期引起的混疊或生理偽影的表現(xiàn)。隨著時(shí)間的推移，支持基于BOLD的靜息狀態(tài)功能連接的神經(jīng)元基礎(chǔ)證據(jù)已經(jīng)從多個(gè)互補(bǔ)的來(lái)源積累起來(lái)。這包括：

（a）在獨(dú)立受試者隊(duì)列中觀(guān)察到的靜息狀態(tài)功能連通性（RSFC）模式的再現(xiàn)性；

（b）在沒(méi)有混疊和與噪聲成分明顯分離的情況下具有持續(xù)性；

（c）其與已知功能網(wǎng)絡(luò)的相似性；

（d）與解剖學(xué)的一致性；

（e）它與大腦皮層活動(dòng)的關(guān)系用其他方法研究；

（f）它在疾病中的系統(tǒng)變化。

1.2機(jī)器學(xué)習(xí)在rs-fMRI中的應(yīng)用

絕大多數(shù)關(guān)于rs-fMRI機(jī)器學(xué)習(xí)的文獻(xiàn)都致力于無(wú)監(jiān)督的學(xué)習(xí)方法。與任務(wù)驅(qū)動(dòng)的研究不同，模擬靜息狀態(tài)的活動(dòng)并不簡(jiǎn)單，因?yàn)闆](méi)有可控的刺激來(lái)驅(qū)動(dòng)這些波動(dòng)。因此，用于描述在基于任務(wù)的fMRI中觀(guān)察到的時(shí)空模式的分析方法通常不適用于rs-fMRI（圖1）。鑒于功能磁共振成像數(shù)據(jù)的高維特性，早期的分析方法側(cè)重于分解或聚類(lèi)技術(shù)，以獲得更好的時(shí)空數(shù)據(jù)特征。像ICA這樣的無(wú)監(jiān)督學(xué)習(xí)方法催化了靜息狀態(tài)網(wǎng)絡(luò)或RSN的發(fā)現(xiàn)。隨后，靜息狀態(tài)腦圖繪制的領(lǐng)域擴(kuò)大了，主要目標(biāo)是創(chuàng)建腦分組，即描述大腦內(nèi)部功能一致的空間分區(qū)的體素（或在表面表示的情況下的頂點(diǎn)）的最佳分組。這些分區(qū)通過(guò)提供探索大腦連通性和功能的區(qū)域參考圖，有助于理解人類(lèi)的功能組織。此外，它們還作為一種流行的數(shù)據(jù)簡(jiǎn)化技術(shù)用于統(tǒng)計(jì)分析或有監(jiān)督的機(jī)器學(xué)習(xí)。

圖1.基于傳統(tǒng)種子的分析方法

最近，從大腦網(wǎng)絡(luò)的靜態(tài)表征出發(fā)，研究表明，在典型的磁共振功能掃描過(guò)程中，RSFC表現(xiàn)出有意義的變化。由于靜止?fàn)顟B(tài)下的大腦活動(dòng)在很大程度上是不受控制的，這使得網(wǎng)絡(luò)動(dòng)力學(xué)更加有趣。使用無(wú)監(jiān)督的模式發(fā)現(xiàn)方法，靜息狀態(tài)模式已經(jīng)被證明在離散的循環(huán)功能連接“狀態(tài)”之間轉(zhuǎn)換，代表不同的心理過(guò)程。在最簡(jiǎn)單和最常見(jiàn)的情況下，動(dòng)態(tài)功能連接性使用滑動(dòng)窗口相關(guān)性來(lái)表示。在這種方法中，在固定長(zhǎng)度的時(shí)間窗口中估計(jì)功能連通性，隨后通過(guò)不同的時(shí)間步長(zhǎng)移動(dòng)該時(shí)間窗口以產(chǎn)生相關(guān)矩陣序列。然后，通過(guò)分解或聚類(lèi)，可以從這個(gè)序列中識(shí)別重復(fù)出現(xiàn)的相關(guān)模式(圖2)。這種功能連接的動(dòng)態(tài)性質(zhì)為理解大腦中不同連接的靈活性開(kāi)辟了新的途徑，因?yàn)樗鼈兣c行為動(dòng)力學(xué)相關(guān)，具有潛在的臨床應(yīng)用價(jià)值。

圖2.機(jī)器學(xué)習(xí)方法在靜息態(tài)fMRI中的應(yīng)用

另一個(gè)，也許在臨床上更有前景的機(jī)器學(xué)習(xí)在rs-fMRI中的應(yīng)用在2000年末得到了擴(kuò)展。這種新的應(yīng)用類(lèi)別利用監(jiān)督機(jī)器學(xué)習(xí)進(jìn)行個(gè)體水平預(yù)測(cè)。靜息態(tài)活動(dòng)的協(xié)方差結(jié)構(gòu)，更普遍地被稱(chēng)為“連接體”，作為疾病的敏感生物標(biāo)志物，在神經(jīng)科學(xué)領(lǐng)域引起了極大的興趣。研究進(jìn)一步表明，一個(gè)人的連接體是獨(dú)特和可靠的，類(lèi)似于指紋。機(jī)器學(xué)習(xí)可以利用這些基于神經(jīng)成像的生物標(biāo)志物來(lái)構(gòu)建診斷或預(yù)測(cè)工具。這些模型的可視化和解釋可以補(bǔ)充統(tǒng)計(jì)分析，為大腦疾病中靜息狀態(tài)模式的功能障礙提供新的見(jiàn)解。鑒于深度學(xué)習(xí)在當(dāng)今時(shí)代的突出地位，幾種新的基于神經(jīng)網(wǎng)絡(luò)的方法也已經(jīng)出現(xiàn)，用于分析rs-fMRI數(shù)據(jù)。這些方法中的大多數(shù)都是針對(duì)單個(gè)受試者水平預(yù)測(cè)的連接體特征提取。

為了組織這一迅速發(fā)展的領(lǐng)域的工作，作者將機(jī)器學(xué)習(xí)方法按方法和應(yīng)用重點(diǎn)細(xì)分為不同的類(lèi)。作者首先根據(jù)無(wú)監(jiān)督學(xué)習(xí)方法的主要關(guān)注點(diǎn)是發(fā)現(xiàn)（a）反映在連貫波動(dòng)中的潛在空間組織，（b）恢復(fù)狀態(tài)連通性的時(shí)間動(dòng)態(tài)結(jié)構(gòu)，還有（c）被試者之間比較的群體水平結(jié)構(gòu)。接下來(lái)，作者繼續(xù)討論有監(jiān)督學(xué)習(xí)。作者通過(guò)討論這些模型中使用的相關(guān)rs-fMRI特征來(lái)組織這一部分，接著討論常用的訓(xùn)練算法，最后討論rs-fMRI在執(zhí)行預(yù)測(cè)方面顯示出前景的各種應(yīng)用領(lǐng)域。

2.無(wú)監(jiān)督學(xué)習(xí)方法

無(wú)監(jiān)督學(xué)習(xí)的主要目標(biāo)是發(fā)現(xiàn)潛在的表示，并解開(kāi)豐富的、未標(biāo)記的數(shù)據(jù)中變化的解釋因素。這些學(xué)習(xí)方法沒(méi)有受到任何形式的目標(biāo)輸出(或標(biāo)簽)的監(jiān)督來(lái)指導(dǎo)學(xué)習(xí)過(guò)程。相反，他們專(zhuān)注于學(xué)習(xí)數(shù)據(jù)中的結(jié)構(gòu)，以便從噪聲中提取相關(guān)信號(hào)。下面，作者回顧一些重要的無(wú)監(jiān)督學(xué)習(xí)方法：

2.1聚類(lèi)

給定數(shù)據(jù)點(diǎn){X1，…，Xn}，聚類(lèi)的目標(biāo)是將數(shù)據(jù)劃分成K個(gè)不相交的組{C1，…，CK}。不同的聚類(lèi)算法在它們的聚類(lèi)目標(biāo)方面是不同的，即最大化聚類(lèi)內(nèi)相似性和聚類(lèi)間的差異性(圖3)。

圖3.用于rs-fMRI分析的無(wú)監(jiān)督學(xué)習(xí)方法的分類(lèi)

2.1.1 K-means

K-means聚類(lèi)是目前最流行的數(shù)據(jù)分割學(xué)習(xí)算法。該算法旨在最小化聚類(lèi)內(nèi)方差。在形式上，這對(duì)應(yīng)于下面的聚類(lèi)目標(biāo):

其中n_j表示集合C_j的基數(shù)(cardinality)。這個(gè)優(yōu)化問(wèn)題是使用迭代算法來(lái)解決的，該算法被稱(chēng)為Lloyd算法。該算法從聚類(lèi)質(zhì)心的初始估計(jì)開(kāi)始，并通過(guò)(a)將每個(gè)數(shù)據(jù)分配給其最近的聚類(lèi)，以及(b)基于這些新的分配更新聚類(lèi)質(zhì)心來(lái)迭代地細(xì)化它們。

如果您對(duì)腦影像數(shù)據(jù)處理感興趣，歡迎瀏覽思影科技課程及服務(wù)，特別是機(jī)器學(xué)習(xí)（可添加微信號(hào)siyingyxf或18983979082咨詢(xún)）：

第十三屆腦影像機(jī)器學(xué)習(xí)班（南京，12.13-18）

第十一屆磁共振腦影像結(jié)構(gòu)班（南京，1.12-17)

第三十六屆磁共振腦影像基礎(chǔ)班（南京，2021.1.6-11）

第十五屆DTI數(shù)據(jù)處理班（南京，12.26-31）

第十九屆磁共振腦網(wǎng)絡(luò)班（南京，1.18-23)

第七屆任務(wù)態(tài)fMRI專(zhuān)題班(重慶，1.14-19）

第三十五屆磁共振腦影像基礎(chǔ)班（重慶，11.30-12.5）

第三十七屆磁共振腦影像基礎(chǔ)班（重慶，1.23-28）

思影科技功能磁共振(fMRI)數(shù)據(jù)處理業(yè)務(wù)

思影科技彌散加權(quán)成像（DWI/dMRI）數(shù)據(jù)處理

思影科技腦結(jié)構(gòu)磁共振成像數(shù)據(jù)處理業(yè)務(wù)（T1)

思影科技嚙齒類(lèi)動(dòng)物（大小鼠）神經(jīng)影像數(shù)據(jù)處理業(yè)務(wù)

思影數(shù)據(jù)處理業(yè)務(wù)三：ASL數(shù)據(jù)處理

思影科技腦影像機(jī)器學(xué)習(xí)數(shù)據(jù)處理業(yè)務(wù)介紹

高斯混合模型的最大似然估計(jì)通常使用期望最大化算法獲得。

2.1.4基于圖的聚類(lèi)

基于圖的聚類(lèi)形成了另一種基于相似性的數(shù)據(jù)劃分方法，可以使用圖來(lái)表示。給定一個(gè)有頂點(diǎn)集V和邊集E的加權(quán)無(wú)向圖G = {V，E}，大多數(shù)圖分割方法都優(yōu)化了一個(gè)分離度量，如歸一化分割(Ncut)。邊權(quán)重w(i,j)表示頂點(diǎn)i和j之間的相似性函數(shù)。Ncut計(jì)算連接兩個(gè)分區(qū)的總邊權(quán)重，并通過(guò)它們與圖中所有節(jié)點(diǎn)的加權(quán)連接對(duì)其進(jìn)行歸一化。一個(gè)雙向規(guī)范化分割準(zhǔn)則通過(guò)同時(shí)最小化簇間相似度和最大化簇內(nèi)相似度，將G劃分為不相交的分區(qū)A和B。該客觀(guān)標(biāo)準(zhǔn)表示為：

然而，直接最小化這個(gè)目標(biāo)是一個(gè)NP-hard(非確定性多項(xiàng)式)問(wèn)題。譜聚類(lèi)算法通?？梢越鉀Q這個(gè)問(wèn)題。這種方法可以進(jìn)一步擴(kuò)展，以獲得圖的K路劃分。與k均值聚類(lèi)或?qū)哟尉垲?lèi)相比，基于圖的聚類(lèi)方法通常對(duì)異常值更具彈性(圖4)。

圖4.流行的聚類(lèi)算法的說(shuō)明:K-means聚類(lèi)將數(shù)據(jù)空間劃分為Voronoi單元，其中每個(gè)觀(guān)察值都被分配給質(zhì)心最近的聚類(lèi)(圖中標(biāo)記為紅色)。高斯假設(shè)每個(gè)聚類(lèi)都是從多元高斯分布中采樣的，并估計(jì)這些概率密度，以生成不同聚類(lèi)的觀(guān)測(cè)值的概率分配。分層聚類(lèi)生成嵌套分區(qū)，其中分區(qū)基于連接標(biāo)準(zhǔn)迭代合并?；趫D的聚類(lèi)劃分了數(shù)據(jù)的圖表示例如，連接不同聚類(lèi)的邊的數(shù)量是最小的。

2.2潛在變量模型

2.2.1分解

基于分解或因式分解的方法假設(shè)觀(guān)察到的數(shù)據(jù)可以分解為更簡(jiǎn)單的矩陣的乘積，通常在這些單獨(dú)的矩陣上強(qiáng)加特定的結(jié)構(gòu)或稀疏性。形式上，給定數(shù)據(jù)點(diǎn)X = [x₁，…，x_n]利用x_i∈ R^D，線(xiàn)性分解技術(shù)尋找基集合W = [w₁，…，w_K]使得W所跨越的線(xiàn)性空間緊密重構(gòu)X。

這里，每個(gè)數(shù)據(jù)點(diǎn)x_i由基集合W的唯一系數(shù)z_i∈R^K表征。典型地，K < D，因此分解相當(dāng)于降維。在矩陣表示法中，目標(biāo)是找到W和Z，使得X ≈ WZ，其中Z = [z₁，…，z_n]。這個(gè)不適定問(wèn)題( ill-posed)一般通過(guò)約束W或z的結(jié)構(gòu)來(lái)解決。

2.2.1.1主成分分析

主成分分析(PCA)是一種基于線(xiàn)性投影并廣泛用于降維的技術(shù)。主成分分析的目標(biāo)是找到一個(gè)正交基W，使投影數(shù)據(jù)Z = W^TX捕獲的方差最大化。這相當(dāng)于最小化基于低維表示數(shù)據(jù)點(diǎn)Z的重建誤差( reconstruction error)。從數(shù)學(xué)上講，這相當(dāng)于解決了下面的優(yōu)化問(wèn)題：

其中F表示Frobenius范數(shù)，而表示D×K維正交矩陣的集合。

2.2.1.2獨(dú)立成分分析

獨(dú)立成分分析(ICA)是一種流行的方法，用于將數(shù)據(jù)分解為統(tǒng)計(jì)獨(dú)立成分的線(xiàn)性組合。在ICA術(shù)語(yǔ)中，W通常被稱(chēng)為混合矩陣，而Z包括源信號(hào)。在上述形式中，ICA假設(shè)源，即Z的行在統(tǒng)計(jì)上是獨(dú)立的。使用“白化”或“解混”矩陣U恢復(fù)源信號(hào)，其中U = W^-1.由于X = WZ，作者獲得了Z = UX流行的算法，因此通過(guò)估計(jì)U來(lái)恢復(fù)源，使得UX的成分在統(tǒng)計(jì)上是獨(dú)立的。常見(jiàn)的獨(dú)立成分分析算法通過(guò)最小化源之間的互信息或最大化它們的非高斯性來(lái)模擬獨(dú)立性。獨(dú)立成分分析通常采用滿(mǎn)秩矩陣分解，并且通常在主成分分析之前進(jìn)行降維。

2.2.1.3稀疏字典學(xué)習(xí)

稀疏字典學(xué)習(xí)被描述為線(xiàn)性分解問(wèn)題，類(lèi)似于ICA/PCA，但在組件Z上具有稀疏約束。這將導(dǎo)致以下形式的非凸優(yōu)化問(wèn)題：

在大多數(shù)實(shí)際應(yīng)用中，這個(gè)優(yōu)化問(wèn)題通過(guò)用L1范數(shù)代替L0范數(shù)來(lái)緩解。

2.2.1.4非負(fù)矩陣分解(NMF)

非負(fù)矩陣分解(NMF)是另一種降維技術(shù)，它尋求數(shù)據(jù)矩陣X的低秩分解，對(duì)成分W和Z具有非負(fù)約束。通常，這對(duì)應(yīng)于解決以下優(yōu)化：

2.2.2隱馬爾可夫模型

隱馬爾可夫模型（HMM）是一類(lèi)針對(duì)序列數(shù)據(jù)的無(wú)監(jiān)督學(xué)習(xí)方法。它們被用來(lái)模擬一個(gè)馬爾可夫過(guò)程，其中觀(guān)測(cè)序列{x₁，…，x_T}被認(rèn)為是從一系列潛在的隱藏狀態(tài){s₁，…，s_T}，可以是離散的。在一個(gè)有K個(gè)狀態(tài)的隱馬爾可夫模型中，假設(shè)s_i可以取{1，…，K} ，HMM的參數(shù)是通過(guò)對(duì)完整的數(shù)據(jù)最大化似然學(xué)習(xí)來(lái)的：

這里，P(s₁|s₀)表示初始狀態(tài)分布π。狀態(tài)轉(zhuǎn)移概率由元素為T_i,j = P(s_t = j| s_t-1 =i)的轉(zhuǎn)移矩陣T定義。條件P(x_t|s_t = k,θ)由發(fā)射概率E[k,x_t]捕獲。因此，該概率模型的參數(shù)θ為{π,T，E}。這種最大似然估計(jì)問(wèn)題是利用期望最大化算法的一種特殊情況，即Baum-Welch算法來(lái)有效地解決的。

2.3非線(xiàn)性嵌入

2.3.1局部線(xiàn)性嵌入

LLE將數(shù)據(jù)投影到降維空間，同時(shí)保留數(shù)據(jù)點(diǎn)及其鄰域之間的局部距離。LLE算法分兩步進(jìn)行。首先，每個(gè)輸入X_i，i∈{ 1，…，n}近似為其K個(gè)最近鄰的線(xiàn)性組合。通過(guò)最小化重建誤差獲得線(xiàn)性子空間W，即

這里，如果X_j不是X_i的K近鄰之一，Wij = 0。在第二步中，通過(guò)最小化嵌入成本函數(shù)來(lái)獲得低維嵌入Y_i,

在后一種優(yōu)化中，W保持固定在Wopt，而Yi是優(yōu)化的。

2.3.2自編碼器

3.無(wú)監(jiān)督學(xué)習(xí)在rs-fMRI的應(yīng)用

無(wú)監(jiān)督的機(jī)器學(xué)習(xí)方法已被證明有希望用于分析具有復(fù)雜結(jié)構(gòu)的高維數(shù)據(jù)，使其與rs-fMRI更加相關(guān)。rs-fMRI中的許多無(wú)監(jiān)督學(xué)習(xí)方法旨在將大腦分成離散的功能子單元，類(lèi)似于地圖集。這些分割是由功能數(shù)據(jù)驅(qū)動(dòng)的，不像Broadmann圖譜那樣使用細(xì)胞結(jié)構(gòu)，也不像自動(dòng)解剖標(biāo)記(AAL)圖譜那樣使用宏觀(guān)解剖特征。第二類(lèi)探索研究大腦網(wǎng)絡(luò)動(dòng)力學(xué)。無(wú)監(jiān)督學(xué)習(xí)被應(yīng)用于研究動(dòng)態(tài)功能連接體，并取得了令人滿(mǎn)意的結(jié)果。最后，無(wú)監(jiān)督學(xué)習(xí)的第三個(gè)應(yīng)用側(cè)重于學(xué)習(xí)RSFC的潛在低維表示，以對(duì)一群受試者進(jìn)行分析。作者將在下面討論這些具有挑戰(zhàn)性的應(yīng)用領(lǐng)域的方法。

3.1發(fā)現(xiàn)具有相干起伏的空間模式

繪制功能不同的神經(jīng)解剖結(jié)構(gòu)的邊界，或識(shí)別大腦中功能耦合區(qū)域的簇是神經(jīng)科學(xué)的一個(gè)主要目標(biāo)。磁共振成像和機(jī)器學(xué)習(xí)方法為實(shí)現(xiàn)這一崇高目標(biāo)提供了一個(gè)有前途的組合。

在rs-fMRI中，典型的方法是利用ICA等技術(shù)將4D-fMRI數(shù)據(jù)分解成不同空間模式的線(xiàn)性疊加，這些模式顯示出連貫的時(shí)間動(dòng)態(tài)。聚類(lèi)是一種非監(jiān)督學(xué)習(xí)方法，用于分析rs-fMRI數(shù)據(jù)。與ICA或字典學(xué)習(xí)不同，聚類(lèi)用于劃分大腦表面（或體積）形成不相交的功能網(wǎng)絡(luò)。在這一階段，區(qū)分兩種稍有不同的聚類(lèi)應(yīng)用是很重要的，因?yàn)樗鼈冇袝r(shí)需要不同的約束：一個(gè)方向側(cè)重于識(shí)別通常在空間上分布的功能網(wǎng)絡(luò)，而另一個(gè)方向則用于劃分大腦區(qū)域。后一種應(yīng)用旨在構(gòu)建功能性神經(jīng)解剖的局部區(qū)域的地圖集，就像自動(dòng)解剖標(biāo)記（AAL）等標(biāo)準(zhǔn)地圖集如何描繪宏觀(guān)解剖區(qū)域。在聚類(lèi)應(yīng)用中，一個(gè)重要的設(shè)計(jì)決策是用來(lái)度量不同體素（或頂點(diǎn)）之間的差異性的距離函數(shù)。在rs-fMRI的情況下，這個(gè)距離函數(shù)要么在體素處的原始時(shí)間序列上計(jì)算，要么在它們的連通性輪廓之間計(jì)算。雖然這兩個(gè)距離的動(dòng)機(jī)是相同的功能一致性思想，但在使用任何一個(gè)標(biāo)準(zhǔn)進(jìn)行優(yōu)化的分組中發(fā)現(xiàn)了某些差異。

幾乎所有這些方法的一個(gè)重要要求是預(yù)先選擇簇/組件的數(shù)量。這些通常是通過(guò)交叉驗(yàn)證或統(tǒng)計(jì)來(lái)確定的，這些統(tǒng)計(jì)數(shù)據(jù)反映了不同尺度下分解/分割的質(zhì)量、穩(wěn)定性或再現(xiàn)性。

3.1.1獨(dú)立成分分析

ICA是rs-fMRI最早和應(yīng)用最廣泛的分析工具之一，它推動(dòng)了對(duì)大腦內(nèi)在網(wǎng)絡(luò)的一些關(guān)鍵的神經(jīng)科學(xué)見(jiàn)解。當(dāng)應(yīng)用于rs-fMRI時(shí)，大腦活動(dòng)表現(xiàn)為不同的空間模式或地圖的線(xiàn)性疊加，每一張地圖都遵循其特有的時(shí)間進(jìn)程（圖5）。這些空間地圖可以反映出一個(gè)連貫的功能系統(tǒng)或噪聲，并且可以使用幾個(gè)標(biāo)準(zhǔn)來(lái)自動(dòng)區(qū)分它們。這種隔離噪聲源的能力使得ICA特別有吸引力。在rs-fMRI的早期，幾項(xiàng)研究表明ICA空間圖和任務(wù)激活研究中已知的皮層功能網(wǎng)絡(luò)有顯著的相似性。當(dāng)?shù)湫偷莫?dú)立成分分析模型是無(wú)噪聲的并且假設(shè)唯一的隨機(jī)性是在信號(hào)源中時(shí)，人們提出了幾種獨(dú)立成分分析的變體來(lái)模擬觀(guān)測(cè)信號(hào)中的加性噪聲。貝克曼等人提出了一種概率ICA（PICA）模型來(lái)提取rs-fMRI數(shù)據(jù)的連通結(jié)構(gòu)。在加性噪聲破壞和源之間統(tǒng)計(jì)獨(dú)立性的情況下，PICA對(duì)線(xiàn)性瞬時(shí)混合過(guò)程建模。De Luca等人結(jié)果表明，PICA能夠可靠地區(qū)分rsn和偽影。這兩部作品在多個(gè)被試的休息狀態(tài)模式上表現(xiàn)出高度一致性。雖然沒(méi)有標(biāo)準(zhǔn)來(lái)驗(yàn)證ICA模式，或任何聚類(lèi)算法，可重復(fù)性或可靠性通常用于定量評(píng)估。最近，Khorshidi等人提出了一種基于ICA的fMRI自動(dòng)去噪策略，稱(chēng)為FIX“FMRIB's ICA-based-X-noiseifier”。作者使用人工標(biāo)注訓(xùn)練了一個(gè)分類(lèi)器，以基于不同的空間/時(shí)間特征來(lái)標(biāo)記事實(shí)成分。這些成分可以表示各種結(jié)構(gòu)化噪聲源，一旦識(shí)別出來(lái)，它們可以從數(shù)據(jù)中減去或回歸，以產(chǎn)生干凈的信號(hào)。

圖5.應(yīng)用示意圖(第3.1節(jié)):在分解中，原始功能磁共振成像數(shù)據(jù)表示為空間模式及其相關(guān)時(shí)間序列的線(xiàn)性組合-獨(dú)立成分分析，空間地圖的獨(dú)立性得到優(yōu)化，而在稀疏字典學(xué)習(xí)中，地圖的稀疏性得到鼓勵(lì)。在聚類(lèi)中，體素的時(shí)間序列或連通性指紋被聚類(lèi)，以將體素分配給不同的功能網(wǎng)絡(luò)。

ICA還可以擴(kuò)展到人口研究中的群體推理。到目前為止，組獨(dú)立成分分析是最廣泛使用的策略，在實(shí)施獨(dú)立成分分析之前，多組受試者功能磁共振成像數(shù)據(jù)沿時(shí)間維度串聯(lián)。然后，通過(guò)反向投影組混合矩陣，或者使用雙重回歸方法，可以從該組分解中獲得個(gè)體水平的獨(dú)立成分分析圖。最近，杜等引入了一種組信息引導(dǎo)的獨(dú)立成分分析方法，以保持單個(gè)獨(dú)立成分分析的統(tǒng)計(jì)獨(dú)立性，其中組獨(dú)立成分分析用于約束相應(yīng)的被試水平獨(dú)立成分分析。Varoquaux等人提出了一個(gè)穩(wěn)健的群體水平獨(dú)立成分分析模型，以方便群體間獨(dú)立成分分析的比較。他們引入了一個(gè)生成框架來(lái)對(duì)獨(dú)立成分分析模式中的兩個(gè)層次的方差進(jìn)行建模，在組層次和被試層次，類(lèi)似于混合效應(yīng)模型的多變量版本。IC估計(jì)程序，稱(chēng)為標(biāo)準(zhǔn)獨(dú)立成分分析。使用典型相關(guān)分析來(lái)識(shí)別受試者之間的共同IC模式的聯(lián)合子空間，并產(chǎn)生能夠很好地代表群體的IC。

或者，也可以計(jì)算個(gè)體特定的獨(dú)立成分分析圖，然后在它們之間建立對(duì)應(yīng)關(guān)系，以生成群體推理；然而，這種方法受到了限制，因?yàn)椴煌茉囌咧g的源分離可能非常不同，例如，由于碎片化。

盡管獨(dú)立成分分析及其擴(kuò)展已被功能磁共振成像社區(qū)廣泛使用，但重要的是要承認(rèn)其局限性。獨(dú)立成分分析對(duì)非高斯數(shù)據(jù)的線(xiàn)性表示進(jìn)行建模。線(xiàn)性變換能否充分捕捉獨(dú)立潛在源(independent latent sources)和觀(guān)察到的高維功能磁共振成像數(shù)據(jù)之間的關(guān)系是不確定的，也可能是不現(xiàn)實(shí)的。與流行的主成分分析不同，獨(dú)立成分分析不提供其成分的順序或能量，這使得無(wú)法區(qū)分強(qiáng)源和弱源。這也使可復(fù)制性分析變得復(fù)雜?？臻g地圖可以任意順序表達(dá)。提取有意義的IC有時(shí)也需要手動(dòng)選擇程序，這可能是低效或主觀(guān)的。在理想情況下，每個(gè)單獨(dú)的成分代表一個(gè)生理上有意義的激活模式或噪聲。然而，這對(duì)于rs-fMRI來(lái)說(shuō)可能是一個(gè)不切實(shí)際的假設(shè)。此外，由于獨(dú)立成分分析假設(shè)源的非高斯性，高斯生理噪聲會(huì)污染提取的成分。此外，由于功能磁共振成像的高維數(shù)，在應(yīng)用獨(dú)立成分分析之前，分析通常進(jìn)行基于主成分分析的降維。主成分分析從數(shù)據(jù)協(xié)方差矩陣的頂部特征向量計(jì)算最高方差的不相關(guān)線(xiàn)性變換(從而解釋數(shù)據(jù)中最大的可變性)。雖然這一步驟有助于消除觀(guān)察噪聲，但它也可能導(dǎo)致信號(hào)信息的丟失，而這些信息對(duì)于后續(xù)分析可能至關(guān)重要。盡管ICA針對(duì)獨(dú)立性進(jìn)行了優(yōu)化，但并不保證獨(dú)立性?；趯?duì)大腦內(nèi)部功能整合的研究，從神經(jīng)科學(xué)的角度來(lái)看，功能單位之間獨(dú)立性的假設(shè)本身就可能受到質(zhì)疑。幾篇論文表明，當(dāng)空間模式稀疏，重疊可以忽略或很少時(shí)，獨(dú)立成分分析特別有效。這暗示了獨(dú)立成分分析的成功是由成分的稀疏性而不是它們的獨(dú)立性驅(qū)動(dòng)的可能性。根據(jù)這些思路，道貝希和他的同事聲稱(chēng)，優(yōu)化空間模式稀疏性的功能磁共振成像表示比優(yōu)化獨(dú)立性的功能磁共振成像表示更有效。

3.1.2學(xué)習(xí)稀疏空間地圖

稀疏字典學(xué)習(xí)是另一種構(gòu)建觀(guān)測(cè)數(shù)據(jù)簡(jiǎn)潔表示的流行框架。Varoquaux等人采用字典學(xué)習(xí)框架從靜息狀態(tài)功能磁共振成像時(shí)間序列中分割功能區(qū)域。他們的方法通過(guò)允許特定被試的空間地圖不同于人口級(jí)別的地圖集，來(lái)說(shuō)明功能邊界中被試間的可變性。具體地說(shuō)，它們優(yōu)化了損失函數(shù)，該損失函數(shù)包括測(cè)量數(shù)據(jù)及其因式分解之間的近似誤差的殘差項(xiàng)、懲罰個(gè)體主體空間圖與組級(jí)潛在圖的大偏差的代價(jià)項(xiàng)、以及促進(jìn)稀疏性的正則化項(xiàng)。除了稀疏性之外，它們還強(qiáng)加了一個(gè)平滑性約束，以便每個(gè)字典中的主要模式在空間上是連續(xù)的，從而構(gòu)建一個(gè)定義明確的分組。為了防止由于平滑度約束而導(dǎo)致的邊緣模糊，亞伯拉罕等人在這個(gè)多被試字典學(xué)習(xí)框架內(nèi)(multi-subject dictionary learning framework)提出一個(gè)全變分正則化。在解釋測(cè)試數(shù)據(jù)時(shí)，這種方法顯示出比競(jìng)爭(zhēng)方法如獨(dú)立分量分析和聚類(lèi)更好的結(jié)構(gòu)化分組。同樣，呂等人提出一種策略，通過(guò)將時(shí)間序列分解成基礎(chǔ)字典及其相應(yīng)的稀疏系數(shù)，學(xué)習(xí)個(gè)體受試者全腦功能磁共振成像信號(hào)的稀疏表示。這里，字典代表功能網(wǎng)絡(luò)的共同激活模式，系數(shù)代表相關(guān)的空間地圖。實(shí)驗(yàn)顯示，與已知在實(shí)踐中產(chǎn)生空間不重疊成分的獨(dú)立分量分析相比，在提取的功能網(wǎng)絡(luò)中存在高度的空間重疊。

3.1.3 k-means聚類(lèi)和混合模型

k-means聚類(lèi)或混合模型常用于功能磁共振成像數(shù)據(jù)的空間分割。體素之間的相似性可以通過(guò)關(guān)聯(lián)它們的原始時(shí)間序列或連通性輪廓來(lái)定義。歐幾里德距離度量也被用于時(shí)間序列的頻譜特征。

K-means聚類(lèi)為人腦的功能組織提供了一些新的見(jiàn)解。它揭示了大腦皮層自然分成兩個(gè)互補(bǔ)的系統(tǒng)，內(nèi)部驅(qū)動(dòng)的“內(nèi)在”系統(tǒng)和刺激驅(qū)動(dòng)的“外在”系統(tǒng)；為區(qū)域網(wǎng)絡(luò)的等級(jí)組織提供了證據(jù)；并且暴露了對(duì)共同變化的靜息狀態(tài)波動(dòng)的解剖學(xué)貢獻(xiàn)。

高蘭等人提出了一種高斯混合模型用于功能磁共振成像信號(hào)的聚類(lèi)。這里，每個(gè)體素處的信號(hào)被建模為N個(gè)高斯密度的加權(quán)和，其中N確定了假設(shè)的功能網(wǎng)絡(luò)的數(shù)量和反映分配給不同網(wǎng)絡(luò)的概率的權(quán)重。大規(guī)模的系統(tǒng)在幾個(gè)分辨率下被探索，揭示了功能組織的內(nèi)在層次。Yeo等人使用對(duì)1000名受試者的rs-fMRI測(cè)量來(lái)估計(jì)大規(guī)模分布式皮層網(wǎng)絡(luò)的組織。他們使用混合模型來(lái)識(shí)別具有相似皮質(zhì)（similar corticocortical）連接特征的體素簇。從穩(wěn)定性分析中選擇聚類(lèi)數(shù)，并以7個(gè)網(wǎng)絡(luò)的粗略分辨率和17個(gè)網(wǎng)絡(luò)的精細(xì)尺度進(jìn)行分組。在數(shù)據(jù)樣本中獲得了高度的可復(fù)制性，表明這些網(wǎng)絡(luò)可以作為功能表征的可靠參考圖。

3.1.4 識(shí)別分層空間組織

幾項(xiàng)研究為大腦中功能網(wǎng)絡(luò)的分級(jí)組織提供了證據(jù)。因此，層次凝聚聚類(lèi)(HAC)為分割rs-fMRI數(shù)據(jù)和探索這種潛在的層次結(jié)構(gòu)提供了一個(gè)自然的工具。聚類(lèi)在靜息態(tài)磁共振成像中的最早應(yīng)用是基于HAC。這項(xiàng)技術(shù)在很大程度上證明了從rs-fMRI數(shù)據(jù)中提取RSN的聚類(lèi)可行性。HAC最近的應(yīng)用集中在為下游分析定義全腦分組。例如，通過(guò)僅考慮局部鄰域作為合并的潛在候選對(duì)象，可以小的分割框架中(in parcels)中加強(qiáng)空間連續(xù)性。

分層聚類(lèi)的一個(gè)優(yōu)點(diǎn)是，與k-means聚類(lèi)不同，它不需要知道聚類(lèi)的數(shù)量，并且是完全確定的。然而，一旦聚類(lèi)樹(shù)形成，樹(shù)圖必須在最能表征“自然”聚類(lèi)的水平上被分割。這可以基于連接不一致性標(biāo)準(zhǔn)、受試者之間的一致性或高級(jí)經(jīng)驗(yàn)知識(shí)來(lái)確定。

雖然層次聚類(lèi)是一種很有前途的rs-fMRI分析方法，但它有一些固有的局限性。它通常依賴(lài)于先驗(yàn)降維，例如通過(guò)使用解剖模板，這可以偏置最終的分組。這是一種貪婪的策略，早期的錯(cuò)誤劃分在后續(xù)迭代中無(wú)法糾正。單連接標(biāo)準(zhǔn)(Single-linkage criterion)在實(shí)踐中可能不太適用，因?yàn)樗谧罱従嚯x合并分區(qū)，因此對(duì)有噪聲的靜息狀態(tài)信號(hào)并不具有固有的魯棒性。此外，不同的度量標(biāo)準(zhǔn)通常會(huì)優(yōu)化集群的不同屬性。例如，單連接集群鼓勵(lì)擴(kuò)展集群，而全連接集群則促進(jìn)緊湊性。這使得距離度量的先驗(yàn)選擇有些隨意。

3.1.5 基于圖的聚類(lèi)

功能磁共振成像數(shù)據(jù)可以自然地以圖形的形式表示。這里，節(jié)點(diǎn)代表體素，邊代表連接強(qiáng)度，通常由體素時(shí)間序列之間或連接圖之間的相關(guān)系數(shù)來(lái)測(cè)。通常，在邊上應(yīng)用閾值來(lái)限制圖的復(fù)雜性。圖形分割方法，如基于Ncut(歸一化分割)標(biāo)準(zhǔn)的方法，已被廣泛用于推導(dǎo)全腦分割。群體水平的分組通常通過(guò)兩個(gè)階段的過(guò)程得出:首先，對(duì)單個(gè)圖進(jìn)行聚類(lèi)以提取功能相關(guān)的區(qū)域，然后是第二階段，對(duì)表征單個(gè)聚類(lèi)圖一致性的群體水平的圖進(jìn)行聚類(lèi)。通過(guò)將連通性圖約束到局部鄰域，或者通過(guò)使用形狀先驗(yàn)(shape priors)，可以容易地實(shí)現(xiàn)空間連續(xù)性。從這個(gè)協(xié)議出發(fā)，沈等人提出一種分組聚類(lèi)方法，該方法在單個(gè)階段聯(lián)合優(yōu)化個(gè)體和分組，并在沒(méi)有任何顯式約束的情況下產(chǎn)生空間平滑的組分組。

功能磁共振成像Ncut標(biāo)準(zhǔn)的一個(gè)缺點(diǎn)是它偏向于創(chuàng)建大小一致的簇，而實(shí)際上功能區(qū)顯示出很大的大小差異。圖的構(gòu)建本身涉及到可能影響聚類(lèi)性能的任意決策，例如選擇一個(gè)閾值來(lái)限制圖形邊緣，或者選擇鄰域來(lái)加強(qiáng)空間連通性(表1)。

（休息片刻，廣告之后，馬上回來(lái)，點(diǎn)擊閱覽）：

第十三屆腦影像機(jī)器學(xué)習(xí)班（南京，12.13-18）

3.1.6 評(píng)論

3.1.6.1 基于交替的網(wǎng)絡(luò)連接表示方法

一些論文對(duì)聚類(lèi)/分解和基于邊界檢測(cè)的網(wǎng)絡(luò)分割方法進(jìn)行了區(qū)分。在rs-fMRI文獻(xiàn)中，已經(jīng)提出了幾種基于非學(xué)習(xí)的分割方法，這些方法利用傳統(tǒng)的圖像分割算法來(lái)識(shí)別基于RSFC突變的功能區(qū)域。聚類(lèi)算法不要求空間連續(xù)性，而基于邊界的方法隱含地要求空間連續(xù)性。相比之下，基于邊界的方法無(wú)法表示長(zhǎng)期的功能關(guān)聯(lián)，并且可能無(wú)法產(chǎn)生像無(wú)監(jiān)督學(xué)習(xí)方法那樣在連接上同質(zhì)的小的聚合(parcels)。這些方法的混合可以產(chǎn)生更好的表示大腦網(wǎng)絡(luò)組織的模型。謝弗等人最近用馬爾可夫隨機(jī)場(chǎng)模型探索了這個(gè)方向。與幾個(gè)交替梯度和基于學(xué)習(xí)的方案相比，生成的地塊顯示出優(yōu)異的同質(zhì)性。此外，以其他方式補(bǔ)充RSFC，可以為劃定區(qū)域邊界提供確鑿的、或許是補(bǔ)充性的信息。最近Glasser等人通過(guò)開(kāi)發(fā)一種產(chǎn)生大腦分割的多模態(tài)方法來(lái)解決這個(gè)問(wèn)題。作者提出了一種半自動(dòng)方法，該方法將有監(jiān)督的機(jī)器學(xué)習(xí)與基于多模態(tài)指紋(結(jié)構(gòu)、功能、連通性和地形)的區(qū)域分割的手動(dòng)標(biāo)注相結(jié)合。這種方法有助于實(shí)現(xiàn)精確繪制人腦功能圖的目標(biāo)。

3.1.6.2 受試者與人群水平分組

rs-fMRI文獻(xiàn)中的重要工作是致力于確定人群平均分組。潛在的假設(shè)是，功能連接圖顯示了跨被試的相似模式，并且這些全局劃分反映了共同的組織原則。然而，個(gè)體水平的分組可能會(huì)產(chǎn)生更敏感的連接特征，用于研究健康和疾病網(wǎng)絡(luò)。這項(xiàng)工作的一個(gè)主要挑戰(zhàn)是將個(gè)人層面的空間地圖與人口模板相匹配，以建立跨主體的對(duì)應(yīng)關(guān)系。獲得具有群組對(duì)應(yīng)的特定被試網(wǎng)絡(luò)的常見(jiàn)方法通常包括反投影和雙重回歸，或者無(wú)監(jiān)督學(xué)習(xí)中的分層先驗(yàn)。雖然許多研究已經(jīng)開(kāi)發(fā)了特定主題的分組，但是這種被試間可變性對(duì)于網(wǎng)絡(luò)分析的重要性直到最近才被討論?？椎仁褂枚嚯A段分層貝葉斯模型開(kāi)發(fā)了高質(zhì)量的特定受試者分組，并表明特定受試者功能地形圖的可變性可以預(yù)測(cè)行為測(cè)量。最近，Salehi等人使用了一種新的基于K-medoids聚類(lèi)的分組方案。表明單獨(dú)的個(gè)體水平的分組可以預(yù)測(cè)個(gè)體的性別。這些研究提出了一個(gè)有趣的想法，即被試水平的網(wǎng)絡(luò)組織，即體素到網(wǎng)絡(luò)的分配可以捕捉個(gè)體固有的概念，就像連接強(qiáng)度一樣。

3.1.6.3 有沒(méi)有通用的‘金標(biāo)準(zhǔn)’腦圖集？

當(dāng)考慮一系列不同的方法、算法或模式時(shí)，在不同的粒度級(jí)別上存在過(guò)多的不同的大腦分區(qū)。到目前為止，還沒(méi)有統(tǒng)一的框架來(lái)推理這些大腦細(xì)胞。可以使用幾個(gè)分類(lèi)來(lái)描述這些分組的生成，例如機(jī)器學(xué)習(xí)或邊界檢測(cè)、分解或聚類(lèi)、多模態(tài)或單峰。即使在一大類(lèi)聚類(lèi)方法中，也不可能找到一種算法能始終如一地優(yōu)于一組簡(jiǎn)單的、理想的劃分屬性。已經(jīng)出現(xiàn)了幾種用于比較不同分組的評(píng)估標(biāo)準(zhǔn)，暴露了工作中固有的權(quán)衡。阿爾斯蘭等人根據(jù)來(lái)自人類(lèi)連接體項(xiàng)目(HCP)的靜息數(shù)據(jù)，對(duì)不同方法下的幾個(gè)分組進(jìn)行了廣泛的比較。通過(guò)獨(dú)立評(píng)估，他們得出結(jié)論，在所有評(píng)估指標(biāo)中，沒(méi)有一個(gè)分組是始終如一的優(yōu)勢(shì)。最近薩萊希等人表明，不同的功能條件，如任務(wù)或休息，產(chǎn)生可重復(fù)的不同分組，從而質(zhì)疑最佳分組的存在，甚至在個(gè)人層面。這些新穎的研究需要重新思考大腦地圖的最終目標(biāo)。幾項(xiàng)研究反映了這樣一種觀(guān)點(diǎn)，即大腦沒(méi)有最佳的功能分區(qū)，而只是一系列有意義的大腦分區(qū)。也許，大腦繪圖不應(yīng)該像布羅德曼區(qū)域那樣，以識(shí)別普遍意義上的功能子單元為目標(biāo)。相反，人腦繪圖的目標(biāo)應(yīng)該重新制定為揭示一致的功能描述，從而能夠?qū)Υ竽X網(wǎng)絡(luò)進(jìn)行可靠和有意義的研究。

3.1.6.4 分解與聚類(lèi)的比較。

在使用分解和聚類(lèi)提取的功能連貫?zāi)Ｊ街幸呀?jīng)觀(guān)察到高度的收斂。分解技術(shù)允許對(duì)數(shù)據(jù)進(jìn)行軟劃分，因此可以產(chǎn)生空間重疊的網(wǎng)絡(luò)。這些模型可能是大腦網(wǎng)絡(luò)的更自然的表示，例如，高度集成的區(qū)域，如網(wǎng)絡(luò)“中樞”，并且可以同時(shí)服務(wù)于多個(gè)功能系統(tǒng)。盡管有可能對(duì)生成的地圖進(jìn)行閾值劃分和重新標(biāo)記，以產(chǎn)生空間上連續(xù)的大腦分區(qū)，但這些技術(shù)并不是自然設(shè)計(jì)來(lái)生成不相交的分區(qū)的。相比之下，聚類(lèi)技術(shù)會(huì)自動(dòng)將體素硬分配給不同的大腦網(wǎng)絡(luò)?？臻g約束可以很容易地合并到不同的聚類(lèi)算法中，以生成連續(xù)的小的集合(contiguous parcels)。分解模型可以適應(yīng)變化的數(shù)據(jù)分布，而聚類(lèi)解決方案由于嚴(yán)格的聚類(lèi)目標(biāo)而允許更少的靈活性。例如，k-means聚類(lèi)函數(shù)尋找捕獲球形簇(spherical clusters)。雖然這些方法之間仍缺乏徹底的比較，但一些研究已經(jīng)確定了選擇兩種技術(shù)進(jìn)行分組之間的權(quán)衡。亞伯拉罕等人在兩個(gè)評(píng)估指標(biāo)上比較了聚類(lèi)方法與組獨(dú)立成分分析和字典學(xué)習(xí)：穩(wěn)定性，反映在獨(dú)立數(shù)據(jù)的體素分配的再現(xiàn)性上，以及數(shù)據(jù)保真度，由獨(dú)立數(shù)據(jù)的解釋方差獲得。他們觀(guān)察到穩(wěn)定性和保真度之間的權(quán)衡:雖然聚類(lèi)模型產(chǎn)生穩(wěn)定區(qū)域，但不能很好地解釋測(cè)試數(shù)據(jù)，但線(xiàn)性分解模型可以很好地解釋測(cè)試數(shù)據(jù)，但代價(jià)是穩(wěn)定性降低。

3.2.發(fā)現(xiàn)動(dòng)態(tài)功能連接的模式

無(wú)監(jiān)督學(xué)習(xí)也被應(yīng)用于研究靜態(tài)網(wǎng)絡(luò)中的時(shí)間組織或動(dòng)態(tài)重構(gòu)模式。這些研究通?；趦蓚€(gè)交替的假設(shè)，即(a)離散“連接狀態(tài)”之間的動(dòng)態(tài)(窗口)功能連接循環(huán)，或者(b)任何時(shí)候的功能連接都可以表示為潛在“連接狀態(tài)”的組合。第一個(gè)假設(shè)使用基于聚類(lèi)的方法或生成模型(如HMMs)進(jìn)行檢驗(yàn)，而第二個(gè)假設(shè)使用分解技術(shù)進(jìn)行建模。一旦在人群中確定了穩(wěn)定狀態(tài)，前一種方法允許作者估計(jì)所有受試者在每個(gè)狀態(tài)下花費(fèi)的時(shí)間比例。這個(gè)量，稱(chēng)為停留時(shí)間或狀態(tài)占用，顯示了個(gè)體之間有意義的變化。重要的是要注意到，在所有這些方法中，RSN或空間模式被假設(shè)為隨著時(shí)間的推移而穩(wěn)定，并且時(shí)間一致性隨時(shí)間而變化。

3.2.1聚類(lèi)

一些研究已經(jīng)發(fā)現(xiàn)了通過(guò)窗口相關(guān)矩陣的k-means聚類(lèi)的循環(huán)動(dòng)態(tài)功能連接模式，稱(chēng)為“狀態(tài)”。與這些重復(fù)狀態(tài)相關(guān)聯(lián)的功能梯度顯示出明顯不同于靜態(tài)功能梯度(圖6)，表明網(wǎng)絡(luò)動(dòng)力學(xué)為靜息大腦提供了新的特征。在精神分裂癥、雙相情感障礙和類(lèi)似精神病的體驗(yàn)域中，健康對(duì)照和患者群體之間的多種狀態(tài)的停留時(shí)間存在顯著差異。

圖6.應(yīng)用示意圖(第3.2節(jié))。為了便于說(shuō)明，數(shù)據(jù)中假設(shè)了三種連接狀態(tài)。

Abrol等人進(jìn)行了一項(xiàng)大規(guī)模研究，使用標(biāo)準(zhǔn)的k-means以及更靈活、限制更寬松的(soft)k-means狀態(tài)估計(jì)算法來(lái)表征大腦狀態(tài)的可復(fù)制性。實(shí)驗(yàn)顯示了大多數(shù)狀態(tài)的再現(xiàn)性，以及它們的匯總度量，例如平均停留時(shí)間和轉(zhuǎn)移概率等。獨(dú)立人群樣本的研究表明，雖然這些研究證實(shí)了反復(fù)出現(xiàn)的FC狀態(tài)的存在，但這些狀態(tài)的行為聯(lián)系仍然未知。在一個(gè)有趣的作品中，王等人使用k-均值聚類(lèi)識(shí)別了兩個(gè)穩(wěn)定的動(dòng)態(tài)FC狀態(tài)，這兩個(gè)狀態(tài)分別與高喚醒和低喚醒的內(nèi)部狀態(tài)相對(duì)應(yīng)。這表明RSFC波動(dòng)是行為狀態(tài)依賴(lài)的，并給出對(duì)RSFC的異質(zhì)性和動(dòng)態(tài)性質(zhì)的解釋。

3.2.2狀態(tài)轉(zhuǎn)移動(dòng)力學(xué)的馬爾可夫模型

HMM是另一個(gè)有價(jià)值的工具來(lái)詢(xún)問(wèn)循環(huán)的功能連接模式。狀態(tài)的概念仍然類(lèi)似于上文針對(duì)集群描述的“FC狀態(tài)”；然而，特征和估計(jì)是截然不同的。與使用滑動(dòng)窗口來(lái)計(jì)算動(dòng)態(tài)功能函數(shù)模式的聚類(lèi)不同，HMMs直接對(duì)rs-fMRI時(shí)間序列建模。因此，他們提供了一個(gè)有希望的替代方案來(lái)克服滑動(dòng)窗口在表征功能函數(shù)變化方面的統(tǒng)計(jì)限制。

通過(guò)采用HMM，出現(xiàn)了一些有趣的結(jié)果。Vidaurre等人發(fā)現(xiàn)不同狀態(tài)的相對(duì)占用率是與行為特征和遺傳相關(guān)聯(lián)的特定受試者的量度。通過(guò)馬爾可夫模型，狀態(tài)之間的轉(zhuǎn)換被揭示為一個(gè)非隨機(jī)序列，它本身是分層組織的。最近，使用HMMs建模的網(wǎng)絡(luò)動(dòng)力學(xué)被證明能夠區(qū)分輕度認(rèn)知障礙患者和對(duì)照組，從而表明它們?cè)谂R床領(lǐng)域的實(shí)用性。

3.2.3尋找跨時(shí)間點(diǎn)的潛在連接模式

理解RSFC動(dòng)力學(xué)的分解技術(shù)與第2.2.1節(jié)中描述的方法有相同的味道:通過(guò)潛在因素解釋數(shù)據(jù)；然而，在這種情況下，興趣的變化是跨時(shí)間的。矩陣分解技術(shù)的采用暴露了(exposes)來(lái)自窗口相關(guān)矩陣的FC模式的基本集合。使用各種分解方法對(duì)動(dòng)態(tài)功能連接（Dynamic FC）進(jìn)行了表征，包括：主成分分析，奇異值分解，非負(fù)矩陣分解和稀疏字典學(xué)習(xí)。

這里，分解方法不同于聚類(lèi)或HMMs，因?yàn)樗鼈儗⒚總€(gè)dFC矩陣與多個(gè)潛在因素而不是單個(gè)組件相關(guān)聯(lián)。為了比較這些替代方法，萊昂納迪等人實(shí)現(xiàn)了廣義矩陣分解，稱(chēng)為kSVD。這種因式分解概括了受變量約束的k均值聚類(lèi)和主成分分析。本研究中的再現(xiàn)性分析表明，dFC更好地表征為多個(gè)重疊的FC模式(表2)。

dFC的分解揭示了健康對(duì)照和PTSD或多發(fā)性硬化癥患者之間以及兒童期和年輕成年期之間網(wǎng)絡(luò)動(dòng)力學(xué)的新變化。

3.3探究被試間差異的潛在因素

無(wú)監(jiān)督學(xué)習(xí)也可以探究在人口上功能連接差異的潛在解釋因素。作者在這里發(fā)現(xiàn)了兩個(gè)應(yīng)用:(1)學(xué)習(xí)FC矩陣的低維嵌入，用于后續(xù)的監(jiān)督學(xué)習(xí)；(2)學(xué)習(xí)群體分組，僅基于FC區(qū)分表型。

3.3.1降維

Rs-fMRI分析受到維數(shù)災(zāi)難的困擾，即高維數(shù)據(jù)稀疏性增加的現(xiàn)象。常用的數(shù)據(jù)特性，如區(qū)域?qū)χg的FC，隨著分區(qū)區(qū)域的數(shù)量而增加。此外，典型功能磁共振成像研究中的樣本量通常為數(shù)十或數(shù)百個(gè)數(shù)量級(jí)，這使得從原始高維數(shù)據(jù)中學(xué)習(xí)可歸納的模式變得更加困難（圖7）。為了克服這一點(diǎn)，線(xiàn)性分解方法，如PCA或稀疏字典學(xué)習(xí)已被廣泛應(yīng)用于功能連接數(shù)據(jù)的降維。

幾種非線(xiàn)性嵌入方法，如局部線(xiàn)性嵌入(LLE)或自動(dòng)編碼器(AEs)也引起了人們的注意。例如，LLE嵌入已被用于rs-fMRI研究，以改善監(jiān)督年齡回歸的預(yù)測(cè)，或用于低維聚類(lèi)以區(qū)分精神分裂癥患者和對(duì)照組。AEs是一種基于神經(jīng)網(wǎng)絡(luò)的替代方法，用于通過(guò)非線(xiàn)性輸入變換生成簡(jiǎn)化的特征集。在一些研究中，它們已被用于RSFC特征降維。為了將學(xué)習(xí)引向支持泛化的參數(shù)空間，AEs也可用于監(jiān)督神經(jīng)網(wǎng)絡(luò)訓(xùn)練的預(yù)訓(xùn)練階段。這種技術(shù)被證明:如使用RSFC提高自閉癥和精神分裂癥的分類(lèi)性能。

圖7.應(yīng)用示意圖(第3.3節(jié))。為了說(shuō)明，將高維連接體降維為3個(gè)潛在成分。

3.3.2聚類(lèi)異質(zhì)性疾病

聚類(lèi)可以暴露群體中顯示相似功能區(qū)的子群體。使用無(wú)監(jiān)督最大邊緣聚類(lèi)，曾等證明了聚類(lèi)可以與疾病類(lèi)別(低v/s控制)相關(guān)聯(lián)，從而產(chǎn)生高分類(lèi)精度。最近Drysdale等人基于RSFC發(fā)現(xiàn)了新的抑郁癥神經(jīng)生理學(xué)亞型。使用一種聚集的分層程序，他們確定了功能障礙連接的聚集模式，其中盡管沒(méi)有外部監(jiān)督，聚集顯示了與不同臨床癥狀特征的聯(lián)系。一些精神疾病，如抑郁癥、精神分裂癥和自閉癥譜系障礙，被認(rèn)為是高度異質(zhì)性的，臨床表現(xiàn)差異很大。基于疾病亞型的不同表征可以建立更好的診斷、預(yù)后或治療選擇系統(tǒng)，而不是將其標(biāo)記為單一綜合征。無(wú)監(jiān)督聚類(lèi)有助于根據(jù)這些疾病的rs-fMRI表現(xiàn)識(shí)別其亞型(表3)。

4. 監(jiān)督學(xué)習(xí)

有監(jiān)督學(xué)習(xí)表示一類(lèi)問(wèn)題，其中向?qū)W習(xí)系統(tǒng)提供數(shù)據(jù)的輸入特征和相應(yīng)的目標(biāo)預(yù)測(cè)(或標(biāo)簽)。目標(biāo)是學(xué)習(xí)輸入和標(biāo)簽之間的映射，以便系統(tǒng)可以為之前看不到的輸入數(shù)據(jù)點(diǎn)計(jì)算預(yù)測(cè)。從rs-fMRI相關(guān)性預(yù)測(cè)自閉癥是一個(gè)典型問(wèn)題。由于內(nèi)在功能因子反映了認(rèn)知相關(guān)功能網(wǎng)絡(luò)之間的相互作用，因此假設(shè)靜息狀態(tài)模式的系統(tǒng)改變可能與病理或認(rèn)知特征相關(guān)。通過(guò)使用rs-fMRI的監(jiān)督算法獲得的有希望的診斷準(zhǔn)確性構(gòu)成了這一假設(shè)的有力證據(jù)。

在本節(jié)中，作者將rs-fMRI特征提取的討論從分類(lèi)算法和應(yīng)用領(lǐng)域中分離出來(lái)。

4.1導(dǎo)出連接體特征

為了使監(jiān)督學(xué)習(xí)有效，最關(guān)鍵的因素是特征提取。從rs-fMRI中獲取相關(guān)神經(jīng)表型取決于各種設(shè)計(jì)選擇。幾乎所有的監(jiān)督預(yù)測(cè)模型都使用從rs-fMRI時(shí)間序列中提取的腦網(wǎng)絡(luò)或“連接體”作為學(xué)習(xí)算法的輸入特征。原型的預(yù)測(cè)流程如圖8所示。在這里，作者討論了監(jiān)督學(xué)習(xí)中大腦網(wǎng)絡(luò)表示的常見(jiàn)選擇的關(guān)鍵方面。

圖8.連接體的通用分類(lèi)/回歸的處理流程

典型流程的第一步是區(qū)域定義和相應(yīng)的時(shí)間序列提取。從體素水平相關(guān)得到的密集連接體由于其高維數(shù)而很少在實(shí)踐中用于監(jiān)督預(yù)測(cè)。腦地圖集描繪了大腦中經(jīng)常用于在超體素尺度上研究RSFC的感興趣區(qū)域。每個(gè)感興趣區(qū)域用不同的時(shí)間過(guò)程表示，通常計(jì)算為感興趣區(qū)域內(nèi)所有體素的平均信號(hào)。因此，數(shù)據(jù)表示為一個(gè)N × T矩陣，其中N表示ROI的數(shù)量，T表示信號(hào)中的時(shí)間點(diǎn)。使用預(yù)定義圖譜的一個(gè)缺點(diǎn)是，它們可能不能很好地解釋rs-fMRI數(shù)據(jù)集，因?yàn)樗鼈儧](méi)有針對(duì)手頭的數(shù)據(jù)進(jìn)行優(yōu)化。一些研究使用數(shù)據(jù)驅(qū)動(dòng)技術(shù)來(lái)定義大腦中的區(qū)域，使用無(wú)監(jiān)督模型，如K均值聚類(lèi)、Ward聚類(lèi)、獨(dú)立分量分析或字典學(xué)習(xí)等。值得注意的是，由于作者使用對(duì)ROI定義整個(gè)大腦RSFC，因此隨著ROI的數(shù)量，這些特性會(huì)隨著ROI的數(shù)量而增長(zhǎng)為(

N²)。因此，在大多數(shù)研究中，網(wǎng)絡(luò)粒度通常限制在10-400 ROI范圍內(nèi)。因此，在大多數(shù)研究中，網(wǎng)絡(luò)粒度通常被限制在10-400個(gè)感興趣區(qū)域的范圍內(nèi)。

這個(gè)流程的第二步包括定義提取連接體矩陣的連接強(qiáng)度。在有監(jiān)督學(xué)習(xí)中，感興趣區(qū)域?qū)χg的功能連通性是功能磁共振成像最常見(jiàn)的特征表示。為了提取連通矩陣，首先需要估計(jì)協(xié)方差矩陣。由于時(shí)間點(diǎn)的數(shù)量有限，樣本協(xié)方差矩陣受到大量估計(jì)誤差的影響。這個(gè)不適定問(wèn)題可以通過(guò)使用收縮變換得到部分解決。然后可以通過(guò)多種方式從協(xié)方差矩陣中估計(jì)連接強(qiáng)度。皮爾遜相關(guān)系數(shù)是一種常用的估計(jì)功能連通性的度量標(biāo)準(zhǔn)。部分相關(guān)是另一個(gè)度量標(biāo)準(zhǔn)，已被證明可以在模擬的rs-fMRI數(shù)據(jù)中更好地估計(jì)網(wǎng)絡(luò)連接。它在去除數(shù)據(jù)中所有其他時(shí)間序列的影響后，測(cè)量?jī)蓚€(gè)時(shí)間序列之間的歸一化相關(guān)性?；蛘?，可以使用協(xié)方差矩陣的基于切線(xiàn)的重新參數(shù)化來(lái)獲得與協(xié)方差矩陣的黎曼(Riemannian)流形有關(guān)的函數(shù)連通矩陣。這些連接系數(shù)可以提高比較患病人群和患病人群的靈敏度。還可以通過(guò)將原始時(shí)間序列分解成多個(gè)頻率子帶并將這些子帶內(nèi)的信號(hào)分別相關(guān)來(lái)定義特定頻率的連接強(qiáng)度。

一些研究偏離了這個(gè)常規(guī)。在圖論分析中，通常將分割的大腦區(qū)域表示為圖節(jié)點(diǎn)，將節(jié)點(diǎn)之間的功能連通性表示為邊權(quán)重。這種基于圖的功能連通性表示，即人類(lèi)“連接體”，已被用來(lái)推斷大腦網(wǎng)絡(luò)的各種拓?fù)涮卣鳎?/span>如模塊化、聚類(lèi)、小世界性等。一些判別模型利用這些基于圖形的測(cè)量方法進(jìn)行個(gè)體水平的預(yù)測(cè)，盡管它們更常用于比較群體。盡管數(shù)量有限，一些研究也探索了RSFC以外的磁共振成像特征（圖9）。低頻波動(dòng)的幅度(ALFF)和rs-fMRI信號(hào)的局部同步或區(qū)域同質(zhì)性(ReHo)是研究自發(fā)大腦活動(dòng)的兩種替代方法，這兩種方法已顯示出辨別能力。最近，一些研究也開(kāi)始探索監(jiān)督模型中動(dòng)態(tài)功能函數(shù)的預(yù)測(cè)能力。

圖9.基于rs-fMRI的監(jiān)督學(xué)習(xí)設(shè)計(jì)選擇總結(jié)

4.2特征選擇

特征選擇的目標(biāo)是從數(shù)據(jù)中去除噪聲、冗余或不相關(guān)的特征，同時(shí)最小化信息損失。對(duì)于訓(xùn)練監(jiān)督學(xué)習(xí)算法來(lái)說(shuō)，特征選擇通常是一個(gè)有利的預(yù)處理步驟，尤其是在小樣本情況下。如果沒(méi)有足夠的正則化，大量的特征會(huì)導(dǎo)致泛化能力的損失。因此，選擇相關(guān)性最高的特征子集有助于構(gòu)建更好的可推廣模型，同時(shí)降低計(jì)算復(fù)雜度。

特征選擇可以有監(jiān)督或無(wú)監(jiān)督的方式進(jìn)行。監(jiān)督或半監(jiān)督特征選擇技術(shù)根據(jù)特征區(qū)分不同類(lèi)別樣本的能力來(lái)選擇特征子集。因此，這些方法依賴(lài)于類(lèi)標(biāo)簽，并可以進(jìn)一步分為濾波器、包裝器或嵌入類(lèi)型模型(filter, wrapper or embedded type models)。濾波器模型首先基于統(tǒng)計(jì)度量(例如。t-test)，然后選擇排名靠前的特征。包裝器模型基于它們的預(yù)測(cè)準(zhǔn)確性來(lái)選擇特征子集，因此需要預(yù)定的分類(lèi)算法。因此，包裝模型表現(xiàn)更好，因?yàn)樗鼈冊(cè)谔卣鬟x擇期間考慮了預(yù)測(cè)精度估計(jì)。然而，由于重復(fù)學(xué)習(xí)和交叉驗(yàn)證，這些模型在計(jì)算上是禁止的。嵌入式模型通過(guò)將特征選擇集成到學(xué)習(xí)算法中，結(jié)合了兩者的優(yōu)點(diǎn)。像LASSO這樣的回歸模型屬于這一類(lèi)，因?yàn)樗鼈兺ㄟ^(guò)鼓勵(lì)稀疏性來(lái)隱含地選擇特征。這些特征選擇方法在唐等人的詳細(xì)綜述中進(jìn)行了深入討論。

特征選擇的另一種方法是輸入降維。像主成分分析或LLE這樣的方法屬于無(wú)監(jiān)督特征選擇技術(shù)的范疇，并且在一些研究中已經(jīng)被用于將特征集減少到可管理的大小。然而，有論文指出的，這些根本不能保證提高分類(lèi)性能，因?yàn)樗鼈儗?duì)類(lèi)標(biāo)簽不敏感。

此外，特征選擇是否必要也取決于下游學(xué)習(xí)算法。一般來(lái)說(shuō)，支持向量機(jī)可以很好地處理高維數(shù)據(jù)，因?yàn)樗请[式正則化的。在支持向量機(jī)的背景下，Vapnik和Chapelle已經(jīng)表明，泛化誤差的上限與特征的數(shù)量無(wú)關(guān)。一般來(lái)說(shuō)，正則化模型能夠處理大型特征集。缺點(diǎn)是這些模型需要交叉驗(yàn)證來(lái)調(diào)整超參數(shù)，如正則化懲罰的權(quán)重。這可能會(huì)減少可用于訓(xùn)練和/或獨(dú)立測(cè)試的有效樣本量。

在某些情況下，利用領(lǐng)域知識(shí)來(lái)指導(dǎo)特征選擇可能是有益的。例如，如果基于先前的研究，已知某些解剖區(qū)域已經(jīng)改變了疾病中的功能連接性，則使用該先前知識(shí)來(lái)構(gòu)建聚焦特征集可能是有利的。

4.3 方法

大多數(shù)應(yīng)用于rs-fMRI的監(jiān)督學(xué)習(xí)方法是基于判別的，即他們?cè)跊](méi)有任何關(guān)于生成過(guò)程的預(yù)先假設(shè)的情況下區(qū)分不同的類(lèi)。重點(diǎn)是正確估計(jì)感興趣的類(lèi)別之間的界限。相同判別函數(shù)的學(xué)習(xí)算法(例如：線(xiàn)性)可以基于不同的目標(biāo)函數(shù)，產(chǎn)生不同的模型。作者在下面描述了常見(jiàn)的模型(圖10)。

圖10：用于rs-fMRI分析的監(jiān)督學(xué)習(xí)方法的分類(lèi)

4.3.3決策樹(shù)和隨機(jī)森林

決策樹(shù)基于輸入特征空間X中的一系列分割來(lái)預(yù)測(cè)輸出Y。該樹(shù)是一個(gè)有向無(wú)環(huán)圖，其節(jié)點(diǎn)代表決策點(diǎn)，邊代表其結(jié)果。當(dāng)?shù)竭_(dá)沒(méi)有子節(jié)點(diǎn)(葉節(jié)點(diǎn))的節(jié)點(diǎn)時(shí)，該樹(shù)的遍歷結(jié)合起來(lái)導(dǎo)致目標(biāo)結(jié)果預(yù)測(cè)。決策樹(shù)通常以自上而下的貪婪方式構(gòu)建，通過(guò)優(yōu)化量化預(yù)測(cè)和基本事實(shí)之間一致性的指標(biāo)，在每一步拆分節(jié)點(diǎn)。例如，在分類(lèi)中，用于量化這種一致性的常用信息論度量是信息增益，即知道X后Y的熵的減少。數(shù)學(xué)上，這表示為

其中，H表示香農(nóng)熵。基于這個(gè)度量，第一次分割將使用給出最大信息增益的屬性X。決策樹(shù)可以提供可解釋性，但通常以降低準(zhǔn)確性為代價(jià)。決策樹(shù)的集合，如隨機(jī)森林或增強(qiáng)樹(shù)，因此在大多數(shù)應(yīng)用中是更受歡迎的選擇，因?yàn)樗鼈儺a(chǎn)生更好的預(yù)測(cè)性能。

4.3.4深層神經(jīng)網(wǎng)絡(luò)

一個(gè)理想的機(jī)器學(xué)習(xí)系統(tǒng)應(yīng)該是高度自動(dòng)化的，在特征提取方面有有限的手工制作，并且對(duì)數(shù)據(jù)和標(biāo)簽之間的映射性質(zhì)有最小的假設(shè)。該系統(tǒng)應(yīng)該能夠從觀(guān)察到的標(biāo)記數(shù)據(jù)中機(jī)械地學(xué)習(xí)對(duì)預(yù)測(cè)有用的模式。神經(jīng)網(wǎng)絡(luò)是非常有前途的自動(dòng)化學(xué)習(xí)方法。這源于它們?cè)诮o定足夠的標(biāo)記數(shù)據(jù)的情況下逼近任意復(fù)雜函數(shù)的能力。

基于深度學(xué)習(xí)的模型或神經(jīng)網(wǎng)絡(luò)定義了一個(gè)映射Y = f(X;θ)并優(yōu)化參數(shù)θ，以產(chǎn)生最佳的函數(shù)逼近。函數(shù)f(?)通常由簡(jiǎn)單的非線(xiàn)性函數(shù)串聯(lián)而成，通常稱(chēng)為層。一個(gè)廣泛使用的層是一個(gè)完全連接的層，它線(xiàn)性組合輸入變量，并應(yīng)用簡(jiǎn)單的元素非線(xiàn)性函數(shù)，如sigmoid。層數(shù)決定網(wǎng)絡(luò)的深度，并控制模型的復(fù)雜性。各層的權(quán)重和偏差通過(guò)基于梯度下降的方法進(jìn)行優(yōu)化，以最小化量化經(jīng)驗(yàn)風(fēng)險(xiǎn)的目標(biāo)函數(shù)。傳統(tǒng)上，神經(jīng)網(wǎng)絡(luò)算法的使用受到限制，因?yàn)樯窠?jīng)成像是一個(gè)數(shù)據(jù)稀缺的領(lǐng)域，使得很難學(xué)習(xí)輸入和預(yù)測(cè)變量之間的可靠映射。然而，隨著數(shù)據(jù)共享和大規(guī)模神經(jīng)影像數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)放發(fā)布，神經(jīng)網(wǎng)絡(luò)最近在rsfMRI社區(qū)中被用于監(jiān)督預(yù)測(cè)任務(wù)。具有完全連接的密集層的神經(jīng)網(wǎng)絡(luò)已經(jīng)被采用來(lái)學(xué)習(xí)從連接特征到疾病標(biāo)簽的任意映射。最近，更先進(jìn)的具有局部感受野的神經(jīng)網(wǎng)絡(luò)模型，如卷積神經(jīng)網(wǎng)絡(luò)(CNNs)，已經(jīng)使用rs-fMRI數(shù)據(jù)顯示出有希望的分類(lèi)精度。神經(jīng)網(wǎng)絡(luò)用一組可學(xué)習(xí)的濾波器取代了卷積的全連通運(yùn)算。這種方法的成功源于它能夠利用遙感-功能磁共振成像的全分辨率3D空間結(jié)構(gòu)，而不必學(xué)習(xí)太多的模型參數(shù)，這要?dú)w功于CNN中的權(quán)重共享。

4.3.5評(píng)論

4.3.5.1 不同方法的優(yōu)缺點(diǎn)。

所有算法都有自己的優(yōu)缺點(diǎn)，方法的選擇應(yīng)該由幾個(gè)因素決定，如預(yù)測(cè)任務(wù)、樣本大小和輸入特征的性質(zhì)。用于神經(jīng)成像應(yīng)用的常見(jiàn)監(jiān)督學(xué)習(xí)算法(如正則化線(xiàn)性模型或SVMs)中的訓(xùn)練目標(biāo)通常是兩個(gè)項(xiàng)的組合:數(shù)據(jù)丟失項(xiàng)，它是經(jīng)驗(yàn)風(fēng)險(xiǎn)或訓(xùn)練誤差的度量，以及先驗(yàn)的正則化懲罰，它有助于打擊學(xué)習(xí)過(guò)程中的過(guò)度擬合(泛化誤差)。懲罰標(biāo)準(zhǔn)可能很關(guān)鍵，并且經(jīng)常受到作者對(duì)數(shù)據(jù)的先驗(yàn)知識(shí)的限制。L1懲罰鼓勵(lì)權(quán)重的稀疏性，而L2懲罰可以允許內(nèi)核化，從而實(shí)現(xiàn)非線(xiàn)性決策函數(shù)。L2懲罰導(dǎo)致密集的先驗(yàn)，并且在學(xué)習(xí)所有特征都有助于預(yù)測(cè)模型的問(wèn)題中是有用的。當(dāng)先驗(yàn)信念表明只有一部分特征有助于預(yù)測(cè)時(shí)，L1懲罰是有用的。一些回歸模型，例如Elastic-Net，采用這兩種懲罰的線(xiàn)性組合，以額外的超參數(shù)為代價(jià)來(lái)調(diào)整兩者之間的權(quán)衡。算法的選擇也受最終目標(biāo)的影響。當(dāng)需要可解釋性而不是最佳性能時(shí)，像決策樹(shù)或LASSO這樣的模型通常是首選的，而如果目標(biāo)是最大化性能，像支持向量機(jī)、隨機(jī)森林或神經(jīng)網(wǎng)絡(luò)這樣的高復(fù)雜性模型是必不可少的。

4.3.5.2對(duì)樣本大小的評(píng)論。

一個(gè)重要的問(wèn)題出現(xiàn)了:訓(xùn)練監(jiān)督學(xué)習(xí)模型的合適樣本量是多少？不出所料，研究表明，學(xué)習(xí)所需的樣本大小取決于模型的復(fù)雜性。強(qiáng)大的非線(xiàn)性算法通常需要更多的訓(xùn)練樣本才能有效。一般來(lái)說(shuō)，人們還會(huì)期望數(shù)據(jù)中的特征越多，就需要越多的訓(xùn)練樣本來(lái)表征它們的分布。因此，用于訓(xùn)練最大似然算法的最小訓(xùn)練規(guī)模通常是輸入維數(shù)、所選模型的復(fù)雜性、數(shù)據(jù)質(zhì)量、數(shù)據(jù)異質(zhì)性、類(lèi)的可分性等的復(fù)雜函數(shù)。

鑒于樣本量對(duì)分類(lèi)性能的顯著影響，理解這種關(guān)系的本質(zhì)是非常必要的。使用學(xué)習(xí)曲線(xiàn)回答這個(gè)問(wèn)題有重要的持續(xù)研究。這些曲線(xiàn)模擬樣本量和泛化誤差之間的關(guān)系，并可用于預(yù)測(cè)訓(xùn)練特定分類(lèi)器所需的樣本量。幾項(xiàng)研究表明，學(xué)習(xí)曲線(xiàn)可以用逆冪律函數(shù)形式很好地表征，用E(n)^β，其中E表示誤差，n表示樣本大小。除了經(jīng)驗(yàn)證明，許多研究也提供了逆冪律模型的理論動(dòng)機(jī)?；谙惹暗姆诸?lèi)研究，對(duì)于給定的應(yīng)用領(lǐng)域，根據(jù)經(jīng)驗(yàn)擬合學(xué)習(xí)曲線(xiàn)的參數(shù)。對(duì)于傳統(tǒng)算法，已知學(xué)習(xí)曲線(xiàn)是平穩(wěn)的，即超過(guò)一定的樣本量，性能的提高是微不足道的。深度學(xué)習(xí)方法的一個(gè)顯著優(yōu)勢(shì)是，如果有足夠的容量，它們可以在更多數(shù)據(jù)的情況下非常好地?cái)U(kuò)展。鑒于最近對(duì)使用rsfMRI進(jìn)行單個(gè)受試者預(yù)測(cè)的興趣激增，估計(jì)rs-fMRI數(shù)據(jù)分類(lèi)的學(xué)習(xí)曲線(xiàn)對(duì)于理解該領(lǐng)域的樣本量要求可能是非常寶貴的。

另一個(gè)關(guān)鍵問(wèn)題涉及估計(jì)預(yù)測(cè)分?jǐn)?shù)的穩(wěn)健性。實(shí)證研究表明，神經(jīng)影像學(xué)研究中典型的小樣本量會(huì)導(dǎo)致預(yù)測(cè)精度的大誤差。例如，在樣本大小為100的情況下，估計(jì)二進(jìn)制分類(lèi)任務(wù)的預(yù)測(cè)精度誤差接近10%。在1000個(gè)樣本的情況下，這個(gè)誤差降低到3%。大的置信界限可能會(huì)使基于少量樣本的研究結(jié)論無(wú)效。

克服樣本量不足限制的一種可能策略是以半監(jiān)督方式利用未標(biāo)記數(shù)據(jù)，以提高監(jiān)督學(xué)習(xí)算法的有效性。遷移學(xué)習(xí)技術(shù)是在低數(shù)據(jù)率下提高分類(lèi)性能的另一種有前途的方法。這些方法利用在大型數(shù)據(jù)集或輔助任務(wù)上訓(xùn)練的神經(jīng)網(wǎng)絡(luò)，通過(guò)將它們微調(diào)到目標(biāo)數(shù)據(jù)集或分類(lèi)任務(wù)。在rs-fMRI分析領(lǐng)域，這些是相對(duì)未被探索的方向，具有緩解樣本量限制的巨大潛力。

4.3.5.3對(duì)模型評(píng)估的評(píng)論。

交叉驗(yàn)證是一種模型評(píng)估技術(shù)，用于估計(jì)預(yù)測(cè)模型的泛化誤差。一個(gè)簡(jiǎn)單的交叉驗(yàn)證策略是保持，其中數(shù)據(jù)被隨機(jī)分成一個(gè)訓(xùn)練和測(cè)試集，并且在這個(gè)單次運(yùn)行中的測(cè)試分?jǐn)?shù)被用作樣本外準(zhǔn)確性的估計(jì)。在大多數(shù)神經(jīng)影像學(xué)研究中，由于樣本量有限，K-fold是主要的交叉驗(yàn)證選擇，因?yàn)樗ㄟ^(guò)重復(fù)保持來(lái)利用所有數(shù)據(jù)點(diǎn)進(jìn)行訓(xùn)練和驗(yàn)證，產(chǎn)生的誤差估計(jì)比經(jīng)典保持要小得多。它首先將數(shù)據(jù)劃分為K個(gè)不重疊的子集，D = {S₁，…，S_K}。對(duì)于每個(gè)折疊i在{1，…，K}中，模型在D Si上訓(xùn)練，在Si上評(píng)價(jià)。然后使用所有折疊的平均精度來(lái)估計(jì)模型性能。而K可以是任何數(shù)值，常見(jiàn)的選擇有5或10.當(dāng)K等于訓(xùn)練集中的樣本數(shù)時(shí)，重采樣過(guò)程被稱(chēng)為留一交叉驗(yàn)證。當(dāng)樣本量較低(通常小于100)時(shí)，這可以用于計(jì)算成本較低的模型。

4.4.監(jiān)督學(xué)習(xí)在磁共振功能磁共振成像中的應(yīng)用

利用靜息態(tài)相關(guān)性進(jìn)行監(jiān)督預(yù)測(cè)任務(wù)的研究正以前所未有的規(guī)模發(fā)展。下面作者描述一些在rs-fMRI中有監(jiān)督機(jī)器學(xué)習(xí)的有趣應(yīng)用。

4.4.1大腦發(fā)育和衰老

機(jī)器學(xué)習(xí)方法在研究正在發(fā)展的連接體方面顯示出希望。在早期有影響的工作中，Dosenbach等人證明了在青少年和年輕成人中使用RSFC預(yù)測(cè)按年齡測(cè)量的大腦成熟的可行性。利用SVM，他們開(kāi)發(fā)了一個(gè)基于預(yù)測(cè)大腦年齡的功能成熟指數(shù)。后來(lái)的研究表明，即使在分布于人類(lèi)一生的不同群體中，大腦成熟度也是可以合理預(yù)測(cè)的。這些工作將磁共振功能磁共振成像作為預(yù)測(cè)健康神經(jīng)發(fā)育的有價(jià)值的工具，并揭示了RSFC與年齡相關(guān)的新動(dòng)態(tài)，如感覺(jué)運(yùn)動(dòng)區(qū)功能性傳導(dǎo)通路的主要變化，或隨年齡增長(zhǎng)而日益分布的功能結(jié)構(gòu)。除了表征伴隨自然衰老的RSFC變化，機(jī)器學(xué)習(xí)也被用來(lái)識(shí)別非典型的神經(jīng)發(fā)育。

4.4.2神經(jīng)和精神疾病

機(jī)器學(xué)習(xí)已被廣泛用于研究rs-fMRI數(shù)據(jù)在各種神經(jīng)和精神疾病中的診斷價(jià)值。神經(jīng)退行性疾病，如阿爾茨海默病，其前驅(qū)狀態(tài)輕度認(rèn)知障礙，帕金森病和肌萎縮性側(cè)索硬化(ALS)，已被機(jī)器學(xué)習(xí)模型使用基于功能連接性的生物標(biāo)記物以有希望的準(zhǔn)確性進(jìn)行分類(lèi)。阿爾茨海默氏癥或多發(fā)性硬化癥等神經(jīng)疾病的腦萎縮模式早在行為癥狀出現(xiàn)之前就出現(xiàn)了。因此，源于結(jié)構(gòu)或功能異常的基于神經(jīng)影像學(xué)的生物標(biāo)志物有利于早期診斷和隨后的干預(yù)以減緩?fù)诵行宰冞^(guò)程。

精神疾病的生物學(xué)基礎(chǔ)一直難以捉摸，這些疾病的診斷目前完全由行為評(píng)估驅(qū)動(dòng)。磁共振成像已經(jīng)成為一種強(qiáng)有力的方法，可以獲得基于成像的生物標(biāo)志物，用于對(duì)精神疾病進(jìn)行診斷性預(yù)測(cè)。使用RSFC的監(jiān)督學(xué)習(xí)算法在對(duì)各種精神疾病的癥狀嚴(yán)重性進(jìn)行分類(lèi)或預(yù)測(cè)方面顯示出有希望的結(jié)果，包括精神分裂癥，抑郁癥，自閉癥譜系障礙，注意缺陷多動(dòng)障礙，社交焦慮障礙，創(chuàng)傷后應(yīng)激障礙和強(qiáng)迫癥。作為這些研究的結(jié)果，針對(duì)這些疾病出現(xiàn)了幾個(gè)新的網(wǎng)絡(luò)破壞假說(shuō)。這些預(yù)測(cè)模型大多基于標(biāo)準(zhǔn)的基于核的支持向量機(jī)，并依賴(lài)感興趣區(qū)域?qū)χg的模糊聚類(lèi)作為判別特征。

4.4.3認(rèn)知能力和人格特征

功能連接也可以用來(lái)預(yù)測(cè)認(rèn)知和行為的個(gè)體差異。與捕捉單一認(rèn)知維度的任務(wù)功能磁共振成像研究相比，由于其不受控制的性質(zhì)，靜息狀態(tài)包含了廣泛的認(rèn)知狀態(tài)。這使得它成為一種豐富的方式來(lái)捕獲跨多個(gè)行為域的個(gè)體間可變性。在健康和病理人群中，基于RSFC的生物標(biāo)記物顯示，最大似然模型可以預(yù)測(cè)流體智力，持續(xù)注意力，記憶表現(xiàn)，語(yǔ)言得分。最近，這些模型的效用也被證明擴(kuò)展到了人格特征，如神經(jīng)質(zhì)、外向性、宜人性和開(kāi)放性。

行為表現(xiàn)的預(yù)測(cè)在臨床環(huán)境中有助于理解病理學(xué)中的RSFC破壞與認(rèn)知功能受損之間的關(guān)系。Meskaldji等人使用回歸模型從不同的連接性測(cè)量預(yù)測(cè)輕度認(rèn)知障礙患者的記憶障礙。西格爾等人通過(guò)訓(xùn)練嶺回歸模型將RSFC和結(jié)構(gòu)與多個(gè)領(lǐng)域(記憶、語(yǔ)言、注意力、視覺(jué)和運(yùn)動(dòng)任務(wù))的表現(xiàn)聯(lián)系起來(lái)，評(píng)估了中風(fēng)患者網(wǎng)絡(luò)中斷的行為意義。其中，記憶缺陷由RSFC更好地預(yù)測(cè)，而結(jié)構(gòu)對(duì)于預(yù)測(cè)視覺(jué)和運(yùn)動(dòng)障礙更重要。這項(xiàng)研究強(qiáng)調(diào)了rs-fMRI如何在研究大腦-行為關(guān)系中補(bǔ)充結(jié)構(gòu)信息。

4.4.4警惕性波動(dòng)與睡眠研究

一些研究使用機(jī)器學(xué)習(xí)來(lái)預(yù)測(cè)rs-fMRI掃描期間的警戒水平。由于靜息狀態(tài)研究不需要任務(wù)處理，受試者容易在清醒和睡眠之間徘徊。rs-fMRI期間警戒狀態(tài)的分類(lèi)對(duì)于消除警戒混淆和污染很重要。在皮質(zhì)-皮質(zhì)RSFC上訓(xùn)練的SVM分類(lèi)器已經(jīng)被證明能夠可靠地檢測(cè)到睡眠呼吸暫停綜合征內(nèi)的睡眠周期。塔利亞祖奇和勞夫斯發(fā)現(xiàn)，在實(shí)驗(yàn)組的三分之一的受試者中，早在進(jìn)入掃描儀3分鐘時(shí)，就出現(xiàn)了失眠。這些發(fā)現(xiàn)很有趣:雖然假設(shè)靜止?fàn)顟B(tài)可以捕捉清醒狀態(tài)，但即使掃描持續(xù)時(shí)間很短，這也不完全正確。這些研究的效用不應(yīng)僅限于分類(lèi)。通過(guò)適當(dāng)?shù)慕忉尯涂梢暬夹g(shù)，機(jī)器學(xué)習(xí)可以在人們進(jìn)入睡眠狀態(tài)時(shí)對(duì)功能組織的重新配置提供新的啟示。

預(yù)測(cè)不同睡眠條件后認(rèn)知反應(yīng)的個(gè)體差異(例如睡眠剝奪)使用機(jī)器學(xué)習(xí)分析rs-fMRI是另一個(gè)有趣的研究方向。人們對(duì)研究睡眠剝奪后的RSFC變化很感興趣。雖然統(tǒng)計(jì)分析已經(jīng)闡明了睡眠剝奪的功能重組特征，但仍有許多關(guān)于易受睡眠剝奪影響的個(gè)體間差異相關(guān)的功能性認(rèn)知模式有待理解。Yeo等人在休息良好的狀態(tài)下，根據(jù)功能連接性數(shù)據(jù)訓(xùn)練了一個(gè)SVM分類(lèi)器，以區(qū)分睡眠剝奪后容易出現(xiàn)警覺(jué)性下降的受試者和更有彈性的受試者，并揭示了各組之間的重要網(wǎng)絡(luò)差異。

4.4.5遺傳可能性

理解基因?qū)Υ竽X結(jié)構(gòu)和功能的影響一直是神經(jīng)科學(xué)的長(zhǎng)期目標(biāo)。在最近的一項(xiàng)研究中，葛等人。采用傳統(tǒng)的統(tǒng)計(jì)框架來(lái)量化全腦血流動(dòng)力學(xué)估計(jì)值的遺傳度。還在機(jī)器學(xué)習(xí)框架內(nèi)對(duì)RSFC的遺傳和環(huán)境基礎(chǔ)進(jìn)行了調(diào)查。米蘭達(dá)-多明戈斯等人在單個(gè)FC簽名上訓(xùn)練SVM分類(lèi)器，以區(qū)分同胞和雙胞胎對(duì)與不相關(guān)的受試者對(duì)。這項(xiàng)研究揭示了幾個(gè)有趣的發(fā)現(xiàn)。從靜息態(tài)功能磁共振成像成功預(yù)測(cè)家族關(guān)系的能力表明，功能連接的各個(gè)方面是由遺傳或獨(dú)特的環(huán)境因素決定的。事實(shí)上，在年輕的成年人中，預(yù)測(cè)仍然是準(zhǔn)確的，這表明這些影響是通過(guò)發(fā)展來(lái)維持的。此外，與非雙胞胎兄弟姐妹相比，預(yù)測(cè)雙胞胎的準(zhǔn)確性更高，這意味著遺傳(而不是環(huán)境)可能是更強(qiáng)的預(yù)測(cè)力。

4.4.6其他神經(jīng)成像方式

機(jī)器學(xué)習(xí)也可以用來(lái)詢(xún)問(wèn)rs-fMRI和其他模式之間的對(duì)應(yīng)關(guān)系。最密切相關(guān)的模態(tài)是任務(wù)-功能磁共振成像。Tavor等人經(jīng)過(guò)訓(xùn)練的多元回歸模型表明，靜息狀態(tài)連接可以預(yù)測(cè)大腦中幾個(gè)行為領(lǐng)域的任務(wù)誘發(fā)反應(yīng)。rs-fMRI是一種無(wú)任務(wù)機(jī)制，它能夠預(yù)測(cè)多項(xiàng)任務(wù)引發(fā)的激活模式，這表明靜息狀態(tài)可以捕捉基于任務(wù)的fMRI所反映的豐富認(rèn)知狀態(tài)。這些回歸模型的性能被證明可以推廣到病理人群，表明這種方法在無(wú)法執(zhí)行某些任務(wù)的人群中繪制功能區(qū)的臨床應(yīng)用。

調(diào)查結(jié)構(gòu)連接如何塑造不同大腦區(qū)域之間的功能聯(lián)系一直是大量研究的焦點(diǎn)。雖然神經(jīng)計(jì)算模型有望實(shí)現(xiàn)這一目標(biāo)，但機(jī)器學(xué)習(xí)模型特別適合捕捉結(jié)構(gòu)-功能關(guān)系中的個(gè)體間差異。Deligianni等人提出了一個(gè)結(jié)構(gòu)輸出多元回歸模型，從DWI導(dǎo)出的結(jié)構(gòu)連接性預(yù)測(cè)靜息態(tài)功能連接性，并通過(guò)交叉驗(yàn)證證明了該技術(shù)的有效性。Venkataraman等人引入了一種新的概率模型，以檢查使用DWI追蹤成像和RSFC測(cè)量的解剖連接性之間的關(guān)系。他們的公式假設(shè)這兩種模式是從一個(gè)共同的連接模板生成的。估計(jì)的潛在連接性估計(jì)被證明可以區(qū)分對(duì)照人群和精神分裂癥人群，從而表明聯(lián)合建模在臨床環(huán)境中也是有用的(表4)。

5. Discussion

5.1給機(jī)器學(xué)習(xí)從業(yè)者的實(shí)用建議

任何機(jī)器學(xué)習(xí)應(yīng)用程序都需要以下條件:(a)反映測(cè)量值和其他歸納偏差之間假定關(guān)系的模型，(b)量化模型捕捉作者數(shù)據(jù)的能力的成本函數(shù)，以及(c)最小化成本的適當(dāng)優(yōu)化算法。機(jī)器學(xué)習(xí)在rs-fMRI中的成功應(yīng)用需要對(duì)這些算法如何工作、失敗時(shí)意味著什么以及最重要的是如何為給定的任務(wù)或假設(shè)選擇算法有一個(gè)整體的觀(guān)點(diǎn)。有三個(gè)關(guān)鍵因素可以決定這一選擇:

1. 研究的問(wèn)題是什么？作者之前的信念是什么？無(wú)監(jiān)督學(xué)習(xí)處理關(guān)于數(shù)據(jù)生成過(guò)程的問(wèn)題。例如，聚類(lèi)和分解方法都被廣泛用于理清rs-fMRI數(shù)據(jù)的潛在因果來(lái)源。然而，它們代表了不同的先驗(yàn)信念，并且經(jīng)?；卮鸩煌难芯繂?wèn)題。例如，在發(fā)現(xiàn)RSNs的背景下，獨(dú)立成分分析假設(shè)潛在成分是獨(dú)立的，并尋求恢復(fù)激活源的空間位點(diǎn)。這種分解進(jìn)一步實(shí)現(xiàn)了功能活動(dòng)與噪聲源的分離。另一方面，聚類(lèi)通常假設(shè)每個(gè)空間位置/區(qū)域的激活可以用一組集群中的一個(gè)底層組件來(lái)解釋。因?yàn)檫@種方法導(dǎo)致不相交的功能網(wǎng)絡(luò)，聚類(lèi)是學(xué)習(xí)空間連續(xù)全腦分組的主要方法。

當(dāng)目標(biāo)是做出預(yù)測(cè)時(shí)，監(jiān)督學(xué)習(xí)算法是通常的選擇。監(jiān)督模型的選擇再次取決于研究問(wèn)題:目標(biāo)是理解標(biāo)簽和特征之間的關(guān)系還是構(gòu)建診斷工具？可解釋性是前者應(yīng)用的關(guān)鍵，而最高的準(zhǔn)確性可以解釋為后者的主要目標(biāo)。因此，必須根據(jù)這一最終目標(biāo)來(lái)選擇模型的復(fù)雜性。作者建議這些目標(biāo)在模型開(kāi)發(fā)之前被很好地定義。

2. 需要多少數(shù)據(jù)？評(píng)估數(shù)據(jù)量以及獲取更多數(shù)據(jù)是否可行非常重要。樣本大小可以限制模型的復(fù)雜性。需要更多的訓(xùn)練示例來(lái)捕捉要素和標(biāo)簽之間的非線(xiàn)性關(guān)系，而不是線(xiàn)性關(guān)系。數(shù)據(jù)保真度和正則化也必須根據(jù)樣本大小進(jìn)行權(quán)衡。在小樣本情況下，正則化變得更加關(guān)鍵，因?yàn)槟Ｐ透赡苓^(guò)度依賴(lài)訓(xùn)練樣本。

3.計(jì)算預(yù)算是多少？有時(shí)，計(jì)算預(yù)算可能是限制性的。例如，某些算法，如深度神經(jīng)網(wǎng)絡(luò)，有很高的計(jì)算需求，可用資源可能無(wú)法支持。此外，如果特征的數(shù)量非常大，訓(xùn)練即使是低復(fù)雜度的模型也會(huì)很耗時(shí)。在這種情況下，運(yùn)行時(shí)復(fù)雜度較低的模型可以?xún)?yōu)先考慮，尤其是對(duì)于早期研究。因此，在選擇合適的模型時(shí)，必須確定時(shí)間、計(jì)算預(yù)算或空間限制。

5.2限制和機(jī)會(huì)

許多最先進(jìn)的rs-fMRI分析技術(shù)植根于機(jī)器學(xué)習(xí)。無(wú)監(jiān)督和有監(jiān)督的學(xué)習(xí)方法都極大地?cái)U(kuò)展了rs-fMRI的應(yīng)用領(lǐng)域。隨著神經(jīng)影像數(shù)據(jù)數(shù)據(jù)的規(guī)?；蛯W(xué)習(xí)算法的進(jìn)步，預(yù)計(jì)未來(lái)將產(chǎn)生更大的影響。盡管機(jī)器學(xué)習(xí)取得了實(shí)際的成功，但理解其目前在應(yīng)用于功能磁共振成像時(shí)遇到的挑戰(zhàn)是很重要的。作者在下面概述了一些重要的限制和未探索的機(jī)會(huì)。

與無(wú)監(jiān)督學(xué)習(xí)方法相關(guān)的最大挑戰(zhàn)之一是缺乏對(duì)應(yīng)評(píng)估的基本事實(shí)（即金標(biāo)準(zhǔn)）。沒(méi)有先驗(yàn)的大腦通用功能圖來(lái)作為分組方案之間比較的基礎(chǔ)。此外，全腦分組通常以不同的功能組織規(guī)模來(lái)定義，從幾個(gè)大規(guī)模的包裹到數(shù)百個(gè)區(qū)域，這使得比較更具挑戰(zhàn)性。盡管已經(jīng)開(kāi)發(fā)了幾個(gè)評(píng)估標(biāo)準(zhǔn)來(lái)解釋這種可變性，但是沒(méi)有一個(gè)單一的學(xué)習(xí)算法在所有方面都表現(xiàn)出始終如一的優(yōu)勢(shì)。由于各種方法之間的權(quán)衡，選擇哪種分組作為網(wǎng)絡(luò)分析的參考在很大程度上是主觀(guān)的。

探索網(wǎng)絡(luò)動(dòng)態(tài)的無(wú)監(jiān)督學(xué)習(xí)方法同樣容易產(chǎn)生主觀(guān)性。通過(guò)離散的精神狀態(tài)來(lái)描述動(dòng)態(tài)的功能連接是困難的，主要是因?yàn)榫駹顟B(tài)可能是無(wú)限的(infinite)。雖然dFC狀態(tài)被認(rèn)為反映了不同的認(rèn)知過(guò)程，但很難獲得不同狀態(tài)的行為對(duì)應(yīng)，因?yàn)殪o息狀態(tài)不是外部探測(cè)的。這又一次使解釋變得困難，并容易產(chǎn)生主觀(guān)偏見(jiàn)。這個(gè)方向的機(jī)器學(xué)習(xí)方法到目前為止依賴(lài)于聚類(lèi)統(tǒng)計(jì)來(lái)固定FC狀態(tài)的數(shù)量。非參數(shù)模型(例如infinite hmm)提供了一個(gè)未經(jīng)探索的、有吸引力的框架，因?yàn)樗鼈兏鶕?jù)底層數(shù)據(jù)的復(fù)雜性自適應(yīng)地確定狀態(tài)的數(shù)量。

使用rs-fMRI進(jìn)行單個(gè)受試者預(yù)測(cè)的一個(gè)重大挑戰(zhàn)是，rs-fMRI特征可以用多種方式描述。沒(méi)有公認(rèn)的時(shí)間序列提取黃金標(biāo)準(zhǔn)圖譜，也沒(méi)有關(guān)于最佳連通性度量的共識(shí)。此外，即使是功能磁共振成像預(yù)處理策略也可能有很大差異。探索這個(gè)空間很麻煩，尤其是對(duì)于像神經(jīng)網(wǎng)絡(luò)這樣訓(xùn)練速度慢的高級(jí)機(jī)器學(xué)習(xí)模型。理想的系統(tǒng)應(yīng)該對(duì)這些選擇保持不變。然而，在rs-fMRI中，這種情況很難出現(xiàn)，因?yàn)樵谶@些因素的相關(guān)預(yù)測(cè)性能中已經(jīng)報(bào)告了較大的偏差。

在大規(guī)模人群中訓(xùn)練穩(wěn)健預(yù)測(cè)系統(tǒng)的另一個(gè)挑戰(zhàn)來(lái)自于多位點(diǎn)rs-fMRI數(shù)據(jù)的異質(zhì)性。與基于任務(wù)的協(xié)議相比，靜止?fàn)顟B(tài)更容易跨站點(diǎn)標(biāo)準(zhǔn)化，因?yàn)樗灰蕾?lài)于外部刺激。然而，不同站點(diǎn)采集協(xié)議和掃描儀特性的差異仍然是異質(zhì)性的重要來(lái)源。盡管樣本量較大，但多點(diǎn)研究表明，與單點(diǎn)研究相比，預(yù)測(cè)精度幾乎沒(méi)有提高，雖然可以從數(shù)據(jù)中標(biāo)準(zhǔn)化站點(diǎn)外效應(yīng)，但在實(shí)踐中需要更先進(jìn)的工具來(lái)減輕這種偏差。

通過(guò)監(jiān)督學(xué)習(xí)方法獲得的高診斷準(zhǔn)確性應(yīng)謹(jǐn)慎解讀。幾個(gè)混雜變量會(huì)導(dǎo)致功能連接性估計(jì)的系統(tǒng)偏差。例如，已知頭部運(yùn)動(dòng)會(huì)影響默認(rèn)模式網(wǎng)絡(luò)和額頂葉控制網(wǎng)絡(luò)中的連接模式。此外，運(yùn)動(dòng)輪廓也在感興趣的子組之間系統(tǒng)地變化，例如，患病患者通常比健康對(duì)照者活動(dòng)更多。除了產(chǎn)生虛假的關(guān)聯(lián)，這可能會(huì)影響監(jiān)督預(yù)測(cè)研究的可解釋性。獨(dú)立的統(tǒng)計(jì)分析對(duì)于排除混雜變量對(duì)預(yù)測(cè)的影響至關(guān)重要，尤其是當(dāng)這些變量在被研究的組之間有所不同時(shí)。

需要進(jìn)行方法創(chuàng)新，以將預(yù)測(cè)精度提高到適合臨床應(yīng)用(clinical translation)的水平。幾個(gè)因素使得跨研究的方法比較乏味。交叉驗(yàn)證是最常用的報(bào)告模型性能的策略。然而，較小的尺寸(在rs-fMRI研究中很常見(jiàn))會(huì)產(chǎn)生較大的誤差條，表明數(shù)據(jù)分割會(huì)顯著影響性能。在基于rs-fMRI數(shù)據(jù)開(kāi)發(fā)預(yù)測(cè)模型時(shí)，可推廣性和可解釋性仍應(yīng)是重點(diǎn)。這些是實(shí)現(xiàn)機(jī)器學(xué)習(xí)模型臨床應(yīng)用的關(guān)鍵屬性。不確定性估計(jì)是任何監(jiān)督學(xué)習(xí)應(yīng)用中的另一個(gè)挑戰(zhàn)；理想情況下，任何分類(lèi)算法的類(lèi)分類(lèi)都應(yīng)該伴隨著反映預(yù)測(cè)不確定性的額外措施。這對(duì)于臨床診斷尤其重要，因?yàn)榱私鈧€(gè)體預(yù)測(cè)的可靠性非常重要。

大多數(shù)現(xiàn)有的研究側(cè)重于對(duì)單一疾病和對(duì)照進(jìn)行分類(lèi)。診斷系統(tǒng)區(qū)分多種精神疾病的能力在臨床環(huán)境中更有用。因此，有必要評(píng)估最大似然模型在鑒別診斷中的有效性。將rs-fMRI與擴(kuò)散加權(quán)磁共振成像等互補(bǔ)模式相結(jié)合，可能會(huì)產(chǎn)生更好的疾病神經(jīng)表型，這是另一個(gè)具有挑戰(zhàn)性但有前途的研究命題。

6. 總結(jié)

本文中，作者已經(jīng)對(duì)rs-fMRI分析中的機(jī)器學(xué)習(xí)技術(shù)的現(xiàn)狀進(jìn)行了全面回顧。作者已經(jīng)根據(jù)應(yīng)用和技術(shù)分別組織了關(guān)于這個(gè)主題的大量文獻(xiàn)，以使來(lái)自神經(jīng)成像和機(jī)器學(xué)習(xí)社區(qū)的研究人員能夠識(shí)別當(dāng)前實(shí)踐中的主流和仍舊存在不足的地方(表5)。從本文的全面閱讀開(kāi)始，你將快速融入rs-fMRI機(jī)器學(xué)習(xí)研究的洪流，并且能夠有效地掌握全貌。

（終于寫(xiě)完了，這讓我想起了十幾年前在奧克蘭山谷打了兩天兩夜戰(zhàn)場(chǎng)，值一個(gè)轉(zhuǎn)發(fā)）