病理檢查是癌癥診斷的“金標準”。病理專家每天要花很多時間研究病理切片,但這些切片提供的有用信息可能很少。 一種被稱為機器學(xué)習(xí)的人工智能技術(shù)可以簡化這一過程,使病理專家能夠?qū)⒆⒁饬性谧钣袃r值的切片上。 盡管癌癥病理診斷至關(guān)重要,但在過去的150年里,病理學(xué)幾乎沒有任何實質(zhì)性的進步。仍需要進行組織活檢,提取薄層腫瘤組織裝片,然后在顯微鏡下觀察。 最近,紀念斯隆·凱特琳癌癥研究中心(MSKCC)數(shù)據(jù)科學(xué)家和機器學(xué)習(xí)專家Thomas Fuchs團隊開發(fā)的一個被稱為Machine Learning的AI系統(tǒng),具有改變癌癥病理學(xué)的潛力。研究團隊訓(xùn)練超級計算機通過數(shù)字化顯微切片識別癌癥,大大加快了樣本分析的進程,使病理專家能將注意力集中在最相關(guān)、信息量最大、最有價值的切片上。 這項研究發(fā)表在《自然醫(yī)學(xué)》雜志上,堪稱癌癥病理學(xué)的一個重要里程碑。研究分析了來自1.5萬多名癌癥患者的4.4萬多張數(shù)字化切片圖像。結(jié)果表明,Machine Learning可以識別出幾乎100%的癌癥活組織切片,預(yù)計在臨床上能減少病理醫(yī)生65-75%的無效讀片工作。 研究團隊已建立了一個精準檢測模型,準確度堪比訓(xùn)練有素的病理專家。這種新型的AI系統(tǒng)有望被全球病理專家用來輔助他們做出更準確的診斷。 研究團隊開發(fā)的新方法運用了強大的計算機技術(shù),并經(jīng)過大量數(shù)據(jù)訓(xùn)練。這是目前建立的首個臨床級別AI系統(tǒng)。 其他計算機模型在面對實際臨床樣本時可能會崩潰?!八鼈兙拖裨谝粋€在空曠的停車場訓(xùn)練出來的自動駕駛汽車。在訓(xùn)練時或許行得通,但一旦來開到大馬路上就可能徹底失敗?!毖芯空哒f。 ● 高效的AI系統(tǒng) Machine learning基于深度學(xué)習(xí)算法,模仿人類大腦通過看實例來識別物體的方式,可在出錯時不斷調(diào)整參數(shù),最終使其能夠高精度地檢測癌癥。 以往的AI系統(tǒng)需要經(jīng)驗豐富的病理專家煞費苦心地對切片進行注釋,以準確地標出癌癥的位置,嚴重限制了可檢查的切片數(shù)量(只有500-1000張切片被用來訓(xùn)練深度學(xué)習(xí)模型)。 而這種AI系統(tǒng)的一個強大特點是,它不需要切片經(jīng)過事先處理,也無需病理專家對切片手動標注,就能夠自我訓(xùn)練以更少的人為輸入來識別癌癥。 首先,每張切片被分成幾千個非常小的單位,AI模型將自己的結(jié)果與病理報告進行比較,通過不斷的迭代從而獲得識別能力,判斷什么是癌癥,什么不是癌癥。 這一系統(tǒng)可用于癌癥病理專家稀缺的地區(qū)。病理專家每天要花好幾個小時研究切片,但這些切片提供的有用信息可能很少。例如,一個病人的前列腺活檢程序可產(chǎn)生45張以上切片,而且每張切片都必須單獨檢查。 “在這樣大量的圖像中檢測微小的癌癥病變?nèi)缤蠛漆?,病理專家必須?jīng)過多年的訓(xùn)練才能可靠地做到這一點。而這個模型提供了一個可復(fù)制的、強大的系統(tǒng),幫助他們更準確、更高效地識別病變,這對病人也更好。” ● 真實的臨床數(shù)據(jù) 研究的樣本來自MSK一年多來拍攝的所有切片,全都是真實的臨床數(shù)據(jù)?;颊呋加腥N類型的常見癌癥:前列腺癌、皮膚癌或已擴散到淋巴結(jié)的乳腺癌。一些瑕疵切片也包括在內(nèi),例如不規(guī)則的氣泡。這會使切片難以分析和閱讀,但都是病理學(xué)家在實際工作中會遇到的。 這與早期的研究形成了鮮明的對比。早期的AI系統(tǒng)只使用“精選”的切片集,因為它們清晰可見、易于分析。 這是第一個真正臨床級的病理學(xué)AI模型。結(jié)果證明,可以利用混亂、無規(guī)則的真實數(shù)據(jù)大規(guī)模訓(xùn)練深度學(xué)習(xí)模型。 ● 最終目標 數(shù)字病理學(xué)在美國還沒有廣泛應(yīng)用于初級診斷。一定程度上是因為這項技術(shù)成本高昂,而且它的好處一直難以證明。Machine learning系統(tǒng)是MSK計算機科學(xué)家、機器學(xué)習(xí)專家、病理學(xué)家和腫瘤學(xué)家多年密切合作的成果。 研究團隊的最終目標是將這一知識大眾化,讓全世界的病理學(xué)家和患者都能從中受益。 |
|