“我們醫(yī)生現(xiàn)在最怕的就是AI研究人員直接上來對我們說:你們什么都不用管,只要給我數(shù)據(jù),我就一定能做出成果來。這類人我遇到過很多?!?/p> 四川大學前副校長、華西醫(yī)院病理科教授步宏曾在雷鋒網(wǎng)的報道中如此說道。 步宏教授指出,他們也許認為只要把數(shù)據(jù)給到即可,但醫(yī)生還必須考慮哪些信息必須隱去,因為涉及到倫理。 “現(xiàn)在不少醫(yī)生開始研究人工智能,我的學生也在看計算機科學專家發(fā)表的結(jié)果,他們有時候會拿著論文跑過來對我說:老師,你看!這篇論文連基本的醫(yī)學常識都沒有。是不是該給它加一個醫(yī)學的reviewer呢?” “如果真的這么做,很多論文其實根本發(fā)表不出來。論文成功發(fā)表并不代表取得了成果,只說明在你reviewer的知識范疇中這種方法是可行的,實際應用到臨床當中,就會暴露很多問題。我也絕不相信隨便拿一堆片子就能做出研究成果來。”步宏教授補充道。 上個月,吳恩達團隊發(fā)布AI+醫(yī)學影像研究成果,聲稱該算法在識別胸透照片中肺炎等疾病上的準確率上超越了人類專業(yè)醫(yī)師。 成果發(fā)布不久,放射科在讀博士Luke Oakden-Rayner隨之發(fā)布長文提出質(zhì)疑:《吳恩達肺炎診斷成果不靠譜?放射科博士長文質(zhì)疑:有些數(shù)據(jù)集根本不能用》。此外,不少影像科主任醫(yī)師也向雷鋒網(wǎng)反饋了該成果存在的諸多問題。 2017年,雷鋒網(wǎng)參加了數(shù)十個頂尖醫(yī)療人工智能大會,而大會期間和會后交流環(huán)節(jié),時常出現(xiàn)影像科醫(yī)生批評市場上眾多醫(yī)學影像AI輔助診斷產(chǎn)品種種問題的情況,而當事人AI從業(yè)者面對這些批評時也往往卻無法反駁,連連點頭。 諸多醫(yī)院科室主任解釋到,過去一年里,他們經(jīng)??吹健癆I讀片準確率、精確率高達百分之九十幾,超越醫(yī)生”這些字眼,這些報道有很多是不負責任的。 這樣的判斷方法回避了醫(yī)學常用的“敏感度”和“特異度”的評價標準。 而AI研究者說采用的“準確率”和“精確率”嚴重依賴于樣本總數(shù)里陽性和陰性的配比,舉個極端的例子,設計一個系統(tǒng),對于所有的輸入都報陽性,即敏感度為100%,特異度為0,這就是個沒有實際用處的系統(tǒng),那么此時取100個測試樣本中,99個為陽性,1個為陰性,此時計算出的準確率為99%,精確率也是99%。 評價醫(yī)學人工智能系統(tǒng)是否有用,要同時看其正確的判斷陽性的能力和正確的判斷陰性的能力,即敏感度和特異度。 不負責任的輿論聲音,從某種程度上激化了醫(yī)生們對AI的反擊心里。 與此同時,醫(yī)院自身的客觀問題,也導致AI專家進入醫(yī)療領(lǐng)域,遠比想象的艱難。 在上一篇文章《“AI+醫(yī)療”這片領(lǐng)土上,科技巨頭為何不再敢說自己是巨頭?》中,我們談到一個很多人沒有異議的觀點:醫(yī)療,是人工智能最難完全攻下來的領(lǐng)域。 醫(yī)工交叉與產(chǎn)學結(jié)合,這兩個由來已久的問題隨著人工智能的興起,讓醫(yī)學影像分析面臨著全新的機遇與挑戰(zhàn)。 隔行如隔山,這對IT界和醫(yī)學界來說尤為貼切,當雙方團隊共同打造一個產(chǎn)品時,面臨著話語體系不同、評價方式不同、誰來主導等諸多問題。 目前這個市場還處于初期,各路玩家相繼入場,產(chǎn)品仍處于科研摸索期。 如果只是將人工智能現(xiàn)有的算法直接套用在醫(yī)學影像領(lǐng)域,很難取得優(yōu)秀成果。與此同時,只滿足把自己定位于一個人工智能研究者來看待醫(yī)學影像問題,將圖像識別技術(shù)單純地嫁接到醫(yī)學影像原有的系統(tǒng)上,即便數(shù)字結(jié)果看起來不錯,但距離“好用的產(chǎn)品”依舊非常遙遠。 AI要順利進入醫(yī)學影像領(lǐng)域,會面臨哪些阻礙? 一、被新技術(shù)與新方法迷惑醫(yī)療行業(yè),技術(shù)不僅要為影像科、病理科服務,還要為臨床服務。 只不過技術(shù)是通過影像科和病理科醫(yī)生最終服務于臨床的,服務于臨床是最高目標。在這個過程中,醫(yī)生的指導非常重要。 科大訊飛醫(yī)療事業(yè)部總經(jīng)理陶曉東博士向雷鋒網(wǎng)介紹了自己的一個原則:要用正確的工具解決正確的問題,即先準確地定義問題,然后尋找合適的解決手段。 “我經(jīng)常跟同事講,一個問題如果能用90年代的技術(shù)解決,就不要想著用2000年的技術(shù);如果能通過人和機器一起解決,就不要想著做全自動的方案。總之,不要總想著用最新的技術(shù),關(guān)鍵是要能解決實際問題?;貧w到醫(yī)療行業(yè),我們要解決的是臨床問題,肯定需要醫(yī)生的合作,一起完成很多工作,并不斷碰撞出火花?!?/p> 二、數(shù)據(jù)不足、質(zhì)量不過關(guān) 影像數(shù)據(jù)的質(zhì)量和數(shù)量很難兼顧,AI從業(yè)者很難找到滿足要求的數(shù)據(jù),尤其是由醫(yī)生標注過的高質(zhì)量數(shù)據(jù)。 除此之外,還要結(jié)合病人的其他信息來判斷,比如實驗室檢測、病理標本等,這更是增加了難度。 廣東省人民醫(yī)院劉再毅教授曾向雷鋒網(wǎng)()介紹了他們團隊所做的項目,該項目過程中需要臨床檢測項目數(shù)據(jù),像基因、血液等相關(guān)檢查數(shù)據(jù),預計能拿到500~600例可用的數(shù)據(jù),但投入起碼為百萬級,這需要科研基金來支撐,醫(yī)院和病人都不可能負擔這個成本。 正因為難以獲取基因、病理等方面數(shù)據(jù),所以一大波創(chuàng)業(yè)公司才蜂擁進入影像領(lǐng)域,他們的很多研究是基于影像信息判斷和推斷基因、病理和臨床信息情況,這是一種可行的方式,但還是需要很多數(shù)據(jù)去驗證。 醫(yī)療數(shù)據(jù)非常稀缺,非常寶貴。 當前很多醫(yī)院的PACS系統(tǒng)做得很不錯,盡管存在影像標準化的問題,至少有圖像,但很多數(shù)據(jù)是沒有的,比如病人做了檢查、手術(shù)、治療之后,沒有完整的隨訪機制,沒有后續(xù)數(shù)據(jù)評估臨床療效和預后等數(shù)據(jù)。醫(yī)生自己做研究,要花很大力氣搜集整理這些數(shù)據(jù)。 除此之外,數(shù)據(jù)質(zhì)控也很關(guān)鍵。比如,通過電話隨訪,如果病人電話號碼更換就無法再聯(lián)系;其次是打電話隨訪信息準確性問題,隨訪信息有很多方面,比如腫瘤手術(shù)之后,有無復發(fā)?是否死亡?化療有無進展? 具體的病逝時間較為容易確認,99%的親人都記得,但“有無進展”很難評估。 另外,每個隨訪工作人員的態(tài)度也影響隨訪質(zhì)量。許多污染數(shù)據(jù)對醫(yī)院的研究團隊不但沒有意義,還有害處。 醫(yī)療數(shù)據(jù)并沒有那么簡單,不僅僅是挖掘一個點,而且包含很多方面。不像購物,調(diào)查消費者的購物習慣時,看其買了什么東西,價格多少,什么時候買的?這類數(shù)據(jù)很明確,也很容易找到。 但醫(yī)療數(shù)據(jù)很多是不確定的,很難打通,這種情況下,具備完整信息的病人資料就尤其寶貴。 醫(yī)院能用的數(shù)據(jù)比例很小,判斷數(shù)據(jù)是否有價值主要取決于具體研究目的。 拿肺癌或其他腫瘤來說,在大醫(yī)院,滿足要求的可能只有10%~20%,即便如此,也已經(jīng)算不錯了;在二甲等地方醫(yī)院,很多病人做完檢查之后,轉(zhuǎn)移到上級醫(yī)院看病,有完整資料的病人可能只有1%~2%。 Google團隊關(guān)于糖尿病視網(wǎng)膜病變的研究成果經(jīng)常被當做范例來解讀,但頂級期刊JAMA(美國醫(yī)學會雜志)也指出了幾點問題: 首先是數(shù)據(jù)量的問題,Google的這項研究用到了128000張醫(yī)學圖像,在很多人看來,數(shù)量已經(jīng)非常旁大,但其中嚴重的病變事實上只有200多個,還遠遠不夠。 疾病種類繁多,沒有人能保證病人檢測出不是糖網(wǎng)后就無需再看醫(yī)生。一個模型并不能解決所有問題,還需要更加龐大的數(shù)據(jù)量。 同時,一項研究成果究竟好不好,不是由工程人員說了算,也不是有了較高的精確率就行,而是要經(jīng)過一系列的驗證。 任何新藥臨床應用之前,都需要經(jīng)過一系列的研究和驗證,證明安全、有效之后才能在臨床中應用。人工智能亦如此。 三、數(shù)據(jù)不互聯(lián)互通優(yōu)質(zhì)的海量數(shù)據(jù)是人工智能算法的基礎,但信息孤島在每個醫(yī)院都是一大難題。病房場景、教學場景、ICU場景、急診場景的系統(tǒng)都是不互通的。各個醫(yī)院之間的信息化水平參差不齊,要實現(xiàn)所有醫(yī)院的數(shù)據(jù)互聯(lián)互通,目前來說還很困難。 當前醫(yī)院內(nèi)部的數(shù)據(jù)都難以做到互聯(lián)互通,存在以下顧慮: 一、不敢。數(shù)據(jù)安全是一個讓行業(yè)比較痛苦的問題。大家都想要彼此的數(shù)據(jù),但是對于到底該不該給對方提供優(yōu)質(zhì)的數(shù)據(jù)支撐又猶豫不決。 二、不愿。醫(yī)療在很多地方都是香餑餑,牽涉到各個部門的利益,大家都不愿意將自己的數(shù)據(jù)交出去。 三、不能。目前懂人工智能的醫(yī)生和懂醫(yī)生的IT人才還極其稀少。 四、脫敏數(shù)據(jù)也存在問題 新華醫(yī)院副院長潘曙明在接受雷鋒網(wǎng)采訪時談到,目前行業(yè)內(nèi)的共識是,將數(shù)據(jù)用于人工智能模型訓練前必須進行脫敏處理,確保病人的隱私。 但這也帶來了數(shù)據(jù)的真實性問題,因為恰恰只有那些敏感的信息(比如身份證號、手機號)才能確保數(shù)據(jù)的真實性和唯一性。 假如保險公司擁有10萬張保單,對方可以說這10萬張保單的數(shù)據(jù)都是真實的,因為每一張保單都對應了一個身證份號。但醫(yī)院的住院號等編碼并不是唯一的,一旦脫敏數(shù)據(jù)進入市場流通,這些數(shù)據(jù)可能會被反復打包多次,丟失真實性和唯一性。 研發(fā)醫(yī)療AI產(chǎn)品必須找到病人數(shù)據(jù)的“源代碼”,這些“源代碼”就存儲在醫(yī)院里。但究竟該如何運用這些數(shù)據(jù),還亟待國家出臺相關(guān)法律進行明確。這些問題需要逐一理清。 五、算法不可解釋性由于醫(yī)療涉及到人的生命健康,因此對AI可解釋性的要求遠高于任何一個行業(yè)。 美國醫(yī)學與生物工程院會士、醫(yī)療人工智能領(lǐng)域國際學術(shù)權(quán)威學者沈定剛教授在雷鋒網(wǎng)的一次報道中指出,可解釋性從理論上來說是非常難的,當然,也有人在做這方面的研究。比如在腦部疾病診斷中,分析到底是大腦哪些區(qū)域的病變導致了老年癡呆或者自閉癥。方法是把結(jié)果往前傳,通過function connectivity分析究竟哪些connectivity和疾病的診斷有關(guān)。 即便如此,沈定剛教授仍舊認為實現(xiàn)可解釋性非常困難,如果要做到這一點,就必須在網(wǎng)絡設計方面做調(diào)整,要求網(wǎng)絡非常稀疏。 客觀環(huán)境受阻,倒逼算法和商業(yè)模式上的創(chuàng)新面對諸多問題,這也迫使不少從業(yè)者不斷從算法和模式上進行創(chuàng)新,如微軟亞洲研究院副院長張益肇在接受雷鋒網(wǎng)采訪時提到,他們團隊在醫(yī)學影像數(shù)據(jù)量受限的情況下,采用弱監(jiān)督學習提升算法的有效性;而一些AI創(chuàng)業(yè)公司拋棄過去較為單薄的產(chǎn)品形態(tài),從深度和廣度上選擇打造更接近醫(yī)生的多鏈條端到端的產(chǎn)品平臺。那么 產(chǎn)業(yè)界如何才能開發(fā)出更好用的醫(yī)學影像輔助診斷產(chǎn)品? 學者們該怎樣利用AI技術(shù)更好地解決醫(yī)學問題? 醫(yī)院各科室需要什么、考量什么、在意什么、應該做什么? CFDA和FDA等監(jiān)管機構(gòu)對人工智能的態(tài)度與規(guī)范進度如何? 近一年來,雷鋒網(wǎng)與近百位應用過AI產(chǎn)品的三甲醫(yī)院院長、影像科主任醫(yī)師、信息中心主任,以及與40位醫(yī)療人工智能公司CEO和數(shù)百位AI研究員進行過深入探討和報道記錄。 本次,雷鋒網(wǎng)精選了63篇深度案例報道,重磅推出“AI+醫(yī)療經(jīng)典項目案例庫”。 深入挖掘「行業(yè)標桿企業(yè)、三甲醫(yī)院、海內(nèi)外名?!谷?3個“醫(yī)療人工智能”案例(平均每篇4300字),全鏈條梳理AI在醫(yī)療各細分場景,尤其是醫(yī)學影像中的“學術(shù)研究+算法實戰(zhàn)+工程實施+解決方案搭建+系統(tǒng)集成+最終落地”流程。(共825頁PDF),助力AI和醫(yī)療從業(yè)者更快地讓產(chǎn)品落地并實現(xiàn)大規(guī)模商業(yè)化。 雷鋒網(wǎng)「AI+醫(yī)療」經(jīng)典項目案例庫 案例數(shù): 63個,平均每篇4300字,共825頁PDF 案例分類: 高校案例、企業(yè)案例、醫(yī)院案例 案例內(nèi)容: 學術(shù)研究+算法實戰(zhàn)+工程實施+解決方案搭建+系統(tǒng)集成+最終落地 在本案例庫中,你將學習到: AI+病種: 掌握人工智能在肺癌、糖尿病視網(wǎng)膜病變、阿爾茨海默病、皮膚病、乳腺癌、咽喉癌、胃癌、結(jié)直腸癌、兒童骨齡等影像方向的全面應用。 案例: 企業(yè)與醫(yī)院的AI商業(yè)化應用落地案例 流程: 了解從算法到工程,再到端到端產(chǎn)品的研發(fā)全流程 經(jīng)驗: 學習多位產(chǎn)、學、醫(yī)專家,在研發(fā)醫(yī)療人工智能項目中走過的彎路、失敗經(jīng)驗與深刻總結(jié),以及新的機遇。 以下為部分案例列表(全版共63個): 高校案例(8個) 中科院研究員田捷:基于醫(yī)療大數(shù)據(jù)和AI技術(shù)的影像組學及其應用 CMU邢波教授團隊:如何利用AI自動生成醫(yī)學影像報告 吳恩達飽受質(zhì)疑的醫(yī)療AI成果,輔助肺炎診斷 丘成桐得意門生顧險峰:機器學習解決不了的醫(yī)學圖像問題,如何用幾何方法攻克? 企業(yè)案例(29個) 騰訊覓影:在解決食管癌、乳腺癌、肺癌、糖網(wǎng)病難題上,我們用了這些AI手段 IBM Watson:關(guān)于它的診療方案,關(guān)于醫(yī)生的評價 微軟亞洲研究院副院長張益肇:你可能有所不知,MSRA已經(jīng)做了8年醫(yī)學影像研究 Google醫(yī)學影像團隊:AI落地醫(yī)院臨床,需恪守這3大原則 科大訊飛醫(yī)療總經(jīng)理陶曉東:三款產(chǎn)品和一個平臺,未來要做基層全科助手 依圖醫(yī)療總裁倪浩:產(chǎn)品只是第一步,與醫(yī)院共同制定新標準才是方向 飛利浦ISD(圖像后處理平臺):詳解腫瘤、神經(jīng)、心臟研究套件 醫(yī)院案例(26個) 廣東省人民醫(yī)院劉再毅教授自述:為什么我是AI醫(yī)療的「旁觀者」? 浙大兒院副院長傅君芬:我們?yōu)楹螘袮I引入兒童骨齡檢測? 北京大學第三醫(yī)院:大數(shù)據(jù)中心在醫(yī)院的落地,需如何去做集成融合與利用 華山醫(yī)院信息中心主任:個性化AI給藥系統(tǒng)的搭建經(jīng)驗與感悟 中國中醫(yī)科學院首席研究員:如何把老中醫(yī)的經(jīng)驗“大數(shù)據(jù)化”,得出診療規(guī)律 江蘇省人民醫(yī)院主任醫(yī)師:AI時代,請熟知我們影像科醫(yī)生的工作思維 |
|
來自: 餐意院 > 《D.社會業(yè)態(tài)》