一晃晃,又是一周過去了。作為一個臨床住院醫(yī),每天起早摸黑,自以為自己很努力,可一到關(guān)鍵時刻,卻拿不出成果出來,就像大BOSS每次調(diào)侃我們做自我介紹時:我叫某某某,我來自哪里哪里,然后,就沒有然后了…… 幸虧自己當(dāng)初加入了《不寫就出局-007》社群,好歹每周還能寫一篇雞湯文章,安慰自己這周我還是有點小成果。 也許有人會問,不寫就出局,出局就出局唄,為什么拼命在那里掙扎? 我的回答是這樣的: 因為我還是有信仰的,信仰我們007這里的人,能堅持到最后的,都不是一般人。不知道寫到第七年,我能不能在南極與戰(zhàn)友們相互擊掌擁抱,但這就是我的夢想,這幾年,我都會為此而努力奮斗。 好了,言歸正傳,開始分享這周的學(xué)習(xí)收獲。 本周主要收獲是關(guān)于數(shù)據(jù)處理部分,我將實操生存分析(Kaplan-Meier生存曲線)、Cox比例風(fēng)險回歸模型以及Logistic回歸模型。 首先需要下載SPSS軟件,百度或者丁香園一堆鏈接,無腦下載安裝就可以了。不過我貌似花了一個多小時給我的MBP成功安裝,試了23、25版本安裝不起來,只有24才可以。 安裝好了以后,接下來我會舉例統(tǒng)計學(xué)最常見的三種統(tǒng)計方法。 實操一:生存分析 首先我們介紹下什么叫生存分析(survival analysis) 生存分析:是將事件的結(jié)果和出現(xiàn)這一結(jié)果所經(jīng)歷的時間結(jié)合起來一類統(tǒng)計分析方法。不僅考慮事件是否出現(xiàn),而且也考慮事件出現(xiàn)的時間長短。 舉例:肺癌腫瘤大小與患者生存時間的關(guān)系。 1.打開SPSS,導(dǎo)入EXCEL表格,依次:分析-生存分析-Kaplan-Meier; 2.將“survivalmonths”及“tumordeath”分別導(dǎo)入中間的框里,因子就是T_stage;并把比較因子和選項里面能勾的都勾上。 3.生成Kaplan-Meier生存曲線,如下。 從上圖我們可以看出,隨著腫瘤大小越大,患者預(yù)后越差。(備注:這是下載的2014年的肺癌數(shù)據(jù),隨訪時間只統(tǒng)計到術(shù)后25個月。) 實操二:Cox比例風(fēng)險回歸模型 前面介紹的是Kaplan-Meier法可以進行單個分組變量的生存分析。那么,為了同時分析多個變量對生存時間和生存結(jié)局的影響,則需要采用多因素生存分析方法,其中一個主要的方法就是Cox比例風(fēng)險回歸模型。 舉例:患者種族、病理分級、TNM分期與患者生存時間的關(guān)系。 1.依次:分析-生存分析-Cox回歸; 2.將“survivalmonths”及“tumordeath”分別導(dǎo)入中間的框里,將“grade”、“race”、“Tstage”、“Nstage”、“Mstage”全部納入?yún)f(xié)變量;并將協(xié)變量里的多分類變量進行分類排序; 3.結(jié)果如下圖。 上表就是多因素Cox比例風(fēng)險回歸模型結(jié)果,舉例解讀,T3的患者的死亡風(fēng)險比T1的患者死亡風(fēng)險高30%。 實操三:二元Logistic回歸 Logistic回歸,它是概率型非線性回歸,是研究二分類(可擴展到多分類)觀察結(jié)果與一些影響因素關(guān)系的一種多變量分析方法。 舉例:肺癌患者種族、病理分級、性別等與腫瘤遠處轉(zhuǎn)移(Mstage)的關(guān)系。 1.依次:分析-回歸-二元Logistic回歸; 2.將二分類變量“Mstage”納入因變量,再將將“gender”、“grade”、“race”、“Tstage”全部納入?yún)f(xié)變量,并將協(xié)變量里的多分類變量進行分類排序; 3.結(jié)果如下圖。 上表就是二元Logistic回歸模型結(jié)果,舉例解讀,腫瘤大小影響腫瘤遠處轉(zhuǎn)移,且T3的患者比T1的患者遠處轉(zhuǎn)移的風(fēng)險高14.9倍。 補充鑒別: 多因素Logistic回歸:協(xié)變量大于等于2個,因變量是二分類或者多分類。 多元Logistic回歸:因變量是多分類變量,協(xié)變量任意。 這就是本周關(guān)于數(shù)據(jù)分析的學(xué)習(xí)收獲,對于SPSS的學(xué)習(xí),我認(rèn)為不僅僅是看視頻操作過程,同等重要的是理解操作背后的統(tǒng)計學(xué)原理,這方面我還需要進一步學(xué)習(xí)。 毒雞湯:再強大的對手,也敵不過你無止盡的堅持;永遠不要逃避問題,因為時間不會給弱者任何回報。 END |
|