目前,醫(yī)療產(chǎn)業(yè)已經(jīng)產(chǎn)生海量數(shù)據(jù),其數(shù)據(jù)類(lèi)型包括中醫(yī)古籍專(zhuān)著、名老中醫(yī)醫(yī)案、病歷、文獻(xiàn)期刊、臨床經(jīng)驗(yàn)總結(jié)等各種中醫(yī)診療相關(guān)數(shù)據(jù),且數(shù)據(jù)類(lèi)型和數(shù)量仍在增加。然而,這些醫(yī)療相關(guān)數(shù)據(jù)在過(guò)去并未得到有效的利用,主要原因歸結(jié)于兩個(gè)方面:數(shù)據(jù)收集整合困難,缺乏數(shù)據(jù)安全共享平臺(tái);標(biāo)準(zhǔn)化難題即中醫(yī)固有的經(jīng)驗(yàn)性、不確定性及模糊性,難以轉(zhuǎn)化為線(xiàn)性邏輯,本研究就這兩方面的問(wèn)題及現(xiàn)狀進(jìn)行綜述。 大數(shù)據(jù)相關(guān)技術(shù)緊緊圍繞數(shù)據(jù)展開(kāi),數(shù)據(jù)的采集、整理、傳輸、存儲(chǔ)、安全、分析、呈現(xiàn)和應(yīng)用等等都屬大數(shù)據(jù)的范疇。中醫(yī)藥在抗擊新冠疫情的過(guò)程中發(fā)揮了重要作用,面臨中醫(yī)藥發(fā)展的重要契機(jī),中醫(yī)藥如何借助數(shù)字化平臺(tái)、大數(shù)據(jù)和人工智能更好的服務(wù)于行業(yè)的發(fā)展和人民健康是目前亟待解決的難題。 1.數(shù)據(jù)收集整合難題 人工智能是交叉學(xué)科的產(chǎn)物,機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等是其主要的研究方向。人工智能和大數(shù)據(jù)關(guān)系密不可分,大數(shù)據(jù)是人工智能“思考”和“決策”的基礎(chǔ),人工智能是大數(shù)據(jù)進(jìn)行價(jià)值化操作的必備條件。林樹(shù)元[1]基于人工智能結(jié)合文獻(xiàn)計(jì)量學(xué)可視化分析,總結(jié)了現(xiàn)今中醫(yī)智能化研究中的數(shù)據(jù)困境導(dǎo)致深度學(xué)習(xí)效果不佳的難題。深度學(xué)習(xí)的模型訓(xùn)練需要以大數(shù)據(jù)為基礎(chǔ),目前,中醫(yī)古籍專(zhuān)著、醫(yī)院病歷、名老中醫(yī)經(jīng)驗(yàn)等數(shù)據(jù)分布散亂,數(shù)據(jù)涉及病人的隱私而變得敏感,因此增加了收集的難度,且缺乏權(quán)威的、安全的數(shù)據(jù)管理和共享平臺(tái),來(lái)源復(fù)雜的資料的收集、整合和數(shù)據(jù)管理將是一項(xiàng)繁瑣艱巨的任務(wù)。 2.標(biāo)準(zhǔn)化難題 中醫(yī)藥大數(shù)據(jù)主要來(lái)源于長(zhǎng)期的臨床實(shí)踐和臨床記錄,這些數(shù)據(jù)都是以自然語(yǔ)言的形式存在,只有將其轉(zhuǎn)換成計(jì)算機(jī)語(yǔ)言才能被進(jìn)一步的使用,其轉(zhuǎn)化的核心是自然語(yǔ)言處理和醫(yī)學(xué)文本識(shí)別。然而,機(jī)器的決策是在理解文本語(yǔ)義的基礎(chǔ)上進(jìn)行的,由于中醫(yī)學(xué)的病例文本大多屬于非結(jié)構(gòu)化數(shù)據(jù)(大數(shù)據(jù)結(jié)構(gòu)化是指數(shù)據(jù)標(biāo)準(zhǔn)化處理、指標(biāo)標(biāo)準(zhǔn)化處理、去重去敏、安全處理等,只有在數(shù)據(jù)結(jié)構(gòu)化之后,數(shù)據(jù)才能用于挖掘和分析),中醫(yī)學(xué)有較多非標(biāo)準(zhǔn)化的表達(dá)方式,人工標(biāo)注成本極高,導(dǎo)致中醫(yī)學(xué)命名體識(shí)別的難度極大[2]。其次,與循證醫(yī)學(xué)不同,中醫(yī)辨證論治的治療原則具有復(fù)雜性,同種疾病會(huì)有不同證型和癥狀,同種癥狀和證型可能出現(xiàn)在同一種疾病中,不同疾病也沒(méi)有清晰的邊界,這些因素會(huì)導(dǎo)致疾病算法模型生成難度增加并使診斷結(jié)果不穩(wěn)定。 3.近幾年的國(guó)內(nèi)外發(fā)展 2015年發(fā)布《北京中醫(yī)藥文化傳播發(fā)展報(bào)告》認(rèn)為,將大數(shù)據(jù)對(duì)患者的信息收集、整理、分析以及在中醫(yī)“治未病”方面的長(zhǎng)期信息跟蹤和預(yù)測(cè)用于中醫(yī)藥學(xué)術(shù)研究和臨床經(jīng)驗(yàn)總結(jié),將成為中醫(yī)藥學(xué)術(shù)在現(xiàn)代可持續(xù)性發(fā)展中的正確道路。近年來(lái)由于受中醫(yī)藥臨床數(shù)據(jù)的信息采集技術(shù)和設(shè)備的限制,很多研究機(jī)構(gòu)對(duì)中醫(yī)大數(shù)據(jù)的研究和建設(shè)停留在對(duì)古籍文獻(xiàn)整理和基礎(chǔ)資料匯集的層次,未形成真正符合現(xiàn)代大數(shù)據(jù)分析意義上的中醫(yī)藥大數(shù)據(jù)系統(tǒng),與大數(shù)據(jù)信息采集連接的中醫(yī)能分析系統(tǒng)的形成差之甚遠(yuǎn)。 隨著近幾年深度學(xué)習(xí)的迅猛發(fā)展,基于這些數(shù)據(jù)難題,在Watson輔助系統(tǒng)的支持下,國(guó)際商業(yè)機(jī)器公司(International Business Machines Corporation)宣布已經(jīng)擁有1 億份患者病歷,3千萬(wàn)份影像數(shù)據(jù)以及 2 億份保險(xiǎn)記錄,數(shù)據(jù)總量超過(guò) 60 萬(wàn) TB,覆蓋人數(shù)約 3 億,然而這些是在花費(fèi)了40億美元的基礎(chǔ)之上獲得的。谷歌公司也在英國(guó)國(guó)家醫(yī)療服務(wù)系統(tǒng)(National Health Service,NHS)的幫助之下獲得了160萬(wàn)患者的健康數(shù)據(jù),但由于醫(yī)療數(shù)據(jù)涉及到患者的隱私,因此引起來(lái)了很多爭(zhēng)議,數(shù)據(jù)收集也變的敏感而困難。潘玉穎[3]提出文本挖掘、文本搜索及Python技術(shù)是解決數(shù)據(jù)難題必備的關(guān)鍵技術(shù),并應(yīng)提出矩陣分析方法構(gòu)建“藥物組合=f(癥狀組合)”的函數(shù)式,建立中醫(yī)數(shù)字化模型,利用人工智能構(gòu)建函數(shù)f,證素賦值法構(gòu)建藥物組合和癥狀組合,模糊數(shù)學(xué)方法賦值證藥信息,從而構(gòu)建適應(yīng)中醫(yī)非線(xiàn)性對(duì)應(yīng)的數(shù)理模型,成功實(shí)現(xiàn)了在tensorflow系統(tǒng)環(huán)境下輸入癥狀可產(chǎn)生處方的效果。 4. 討論 中醫(yī)學(xué)講求天人合一的整體原則,研究對(duì)象始終是人這個(gè)整體,而非人的病,因此中醫(yī)藥構(gòu)建的是關(guān)系本體而非實(shí)體本體,面對(duì)這樣一個(gè)復(fù)雜的巨系統(tǒng),我們要處理其中諸元素的相關(guān)性;其次我們需要將研究的對(duì)象置于自然、社會(huì)、心理的不同環(huán)境之中,從整體出發(fā)去考慮問(wèn)題,因此發(fā)展出非線(xiàn)性的辯證體系。最后,將生命科學(xué)與人文科學(xué)有機(jī)地結(jié)合起來(lái)也是中醫(yī)藥治療疾病的重要方法。 大數(shù)據(jù)具有全體性、混雜性和相關(guān)性,同時(shí),大數(shù)據(jù)的思維也是非線(xiàn)性的。醫(yī)學(xué)領(lǐng)域的大數(shù)據(jù)提供了研究對(duì)象在社會(huì)中各個(gè)維度的數(shù)據(jù),所以在理想的情況下,一個(gè)從社會(huì)到身體再到心理的全方位的分析無(wú)疑是生命科學(xué)與人文科學(xué)的結(jié)合。 中醫(yī)藥大數(shù)據(jù)成果的產(chǎn)出不僅需要互聯(lián)網(wǎng)技術(shù)和人工智能方面的人才,在中醫(yī)數(shù)字化模型的構(gòu)建中,中醫(yī)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)等相關(guān)專(zhuān)業(yè)知識(shí)也同樣重要,因此同時(shí)具備這些專(zhuān)業(yè)素養(yǎng)的綜合性人才的培養(yǎng)是中醫(yī)藥大數(shù)據(jù)獲得成果的重要一步。同時(shí),如何安全管理這些數(shù)據(jù),防止個(gè)人隱私數(shù)據(jù)泄露又能合理利用,也是需要嚴(yán)肅對(duì)待的問(wèn)題。 |
|
來(lái)自: 新用戶(hù)99775517 > 《待分類(lèi)》