本文首發(fā)于 ”百味科研芝士“ 微信公眾號,轉(zhuǎn)載請注明:百味科研芝士,F(xiàn)ocus科研人的百味需求 想研究疾病OS,PFS,DFS? 想研究預(yù)后如何制作生存曲線? 百味芝士今日為你盤點幾款生存曲線制作方法。
第一款:Kaplan-Meier Plotter數(shù)據(jù)庫 ★★★★☆ Kaplan-Meier Plotter數(shù)據(jù)庫這是今天推薦首款生存曲線制作方法,官網(wǎng)(http:///analysis/),它是長的這個樣子的。
咋一看,Kaplan-Meier Plotter數(shù)據(jù)庫似乎只能研究6個癌種,小編之前也犯了同樣的錯誤,“pan-cancer”(pancreatic cancer,胰腺癌像不像?)。其實,“pan-cancer”是畫中有畫,不信咱打開瞧瞧! 先看看mRNA表達譜,還有不下20個癌種可供研究,而主頁上面的五個癌種的信息是比較詳細的。同樣,也可以查看miRNA表達譜的“pan-cancer”,包含的癌種也有20種。
Kaplan-Meier Plotter數(shù)據(jù)庫的數(shù)據(jù)來源于GEO(僅限Affymetrix微陣列),EGA和TCGA,缺點是每個數(shù)據(jù)庫每兩年更新一次。走起來~ 點擊癌種“Lung Cancer”,左上的搜索框輸入“KRAS”,默認參數(shù)。
下拉頁面,點擊“Draw Kaplan-Meier Plotter”,簡單粗暴,出圖!
最后,我們看看參數(shù)設(shè)置吧,在“survival”這里可以選擇患者的總生存期(OS)、首次進展生存期(FP)、再次進展生存期(PPS)。而對于隨訪時間的終點也可以設(shè)置,在“Survival”菜單下面的“Follow up threshold”里面。
接著,看看其他參數(shù)設(shè)置,左上角是探針設(shè)置,根據(jù)自己的研究選擇不同的探針。病理參數(shù)里面可以設(shè)置病理類型、分級、分期、T、N、M、性別、吸煙史。在治療分組中,也可以看不同治療的預(yù)后。而數(shù)據(jù)集里面也囊括了TCGA以及GEO的芯片數(shù)據(jù)。最后的COX分析也可以選擇單因素和多因素分析。
通過參數(shù)設(shè)置,我們可以分析不同亞組、不同病理參數(shù)、不同治療模式、不同數(shù)據(jù)集的患者預(yù)后,由此也看出來Kaplan-Meier Plotter數(shù)據(jù)庫的強大。 第二款:SPSS軟件 ★★★★★ SPSS軟件制作生存曲線是最經(jīng)典的做法,只要你有數(shù)據(jù)就能做,就是不熟悉SPSS的孩紙會感覺稍稍復(fù)雜。直接上數(shù)據(jù)吧!假定:分組信息(0低表達;1高表達)、存活狀態(tài)death(0存活;1死亡)、生存時間time(月)。
數(shù)據(jù)錄入完成后,依次點擊分析→生存函數(shù)→Kaplan-Meier
參數(shù)設(shè)置:time-時間,death-狀態(tài),點擊定義事件(終點時間設(shè)置為1死亡)
設(shè)置檢驗統(tǒng)計量:對數(shù)秩、Breslow
選項里面點擊生存函數(shù)
直接出圖!當(dāng)然,這個圖在SPSS中可以進行簡單修改,可以試一試!
第三款:GraphdPad Prism軟件 ★★★★☆ GraphdPad Prism軟件是一款超級好用的專業(yè)醫(yī)學(xué)繪圖軟件,在醫(yī)藥生物領(lǐng)域被廣泛使用,擁有ROC曲線分析、Bland-Altman分析功能以及GraphPad Prism的線性/非線性擬合功能,所以,制作生存曲線對它來說只是小菜。 首先,錄入數(shù)據(jù),注意它與SPSS的輸入?yún)^(qū)別,即實驗組(EXP)和對照組(CON)輸入在不同的兩列中。
點擊Graphs中的Data 1,右側(cè)即顯示制作好的生存曲線。
調(diào)色:鼠標雙擊其中一條曲線,更改顏色后點擊OK。
下面是更換顏色后的圖,看著還不錯~
圖還行,貌似缺點東西,P值!點擊菜單欄中“Analyze”,選擇“survival curve”,然后點擊OK。
直接查看P值及其他數(shù)據(jù)。相比SPSS來說,略顯麻煩,但是對圖形的修改,還算不錯,有機會下次為大家推送GraphdPad Prism。
第四款:UALCAN網(wǎng)站 ★★★★★ UALCAN(http://ualcan.path./index.html)主要是基于TCGA數(shù)據(jù)庫中的相關(guān)癌癥數(shù)據(jù)進行分析的網(wǎng)站,操作仍然是簡單粗暴,先看主頁。
開始表演了~抖一下“Analysis”,方框里面根據(jù)需要更改。
點一下“Explore”,繼續(xù)點“Show all gene expression in same page”,別停!接著點“Survival”,完事兒!
話說這圖出的真驚喜,連續(xù)好幾張(不試后悔)!必須給五星!
第五款:GEPIA網(wǎng)站 ★★★★★ GEPIA在百味里面推送過~,官網(wǎng)(http://gepia./)
收索框中輸入基因,點擊“Survival Analyze”。
跳轉(zhuǎn)頁面,在下圖紅框里面選擇一個腫瘤患者數(shù)據(jù)集,比如“LUAD”。
點擊下方“Plot”,出圖~666。
第六款:cbiportal網(wǎng)站 ★★★★★ 這個網(wǎng)站(https://www./)大家太熟悉了,不再多說!點擊鏈接直接查看推文:懶人如何分析TCGA數(shù)據(jù)之cBioportal網(wǎng)站。
第七款:Oncolnc網(wǎng)站 ★★★★★ 既然是“Party”,那就再來介紹一個網(wǎng)站好了!OncoLnc,也是一款基于TCGA數(shù)據(jù)預(yù)后分析網(wǎng)站,官網(wǎng)網(wǎng)址:http://www./。
輸入基因名:可以是基因名,也可以輸入mRNA,microRNA和lncRNA。
點擊“Submit”后,查看結(jié)果~頁面如下,顯示了腫瘤類型、回歸系數(shù)、P值、基因表達水平等參數(shù)。
比如選擇肺腺癌后,點擊“Yes Please!”在這個頁面比如選擇低位4分位和高位4分為的表達量,也就是25:25,當(dāng)然,也可以選擇50:50也就是取中位數(shù)。
點擊提交,生存曲線就做好了,直接導(dǎo)出PDF保存。
下拉頁面,保存生存分析的數(shù)據(jù),分析結(jié)束。
第八款:R軟件 ★★★★☆ R語言做生存曲線作為今天的壓軸方法,在這里以TCGA數(shù)據(jù)庫中的數(shù)據(jù)為例,分析差異基因表達情況與患者的生存關(guān)系。 首先用hash函數(shù)從矩陣normalizeExp.txt中提取TOP2A的基因表達量。
將基因表達量與生存文件time文件整合
survival函數(shù)制作生存曲線
出圖~學(xué)會了嗎?
縱觀這些軟件或數(shù)據(jù)庫,都各有千秋,根據(jù)需要,可以任意選擇。小編今天總結(jié)了常見的制作生存曲線的八種方法,然而,制作生存曲線的方法遠不止這些,小伙伴們,跟帖吧~
|
|