本文的臨床數(shù)據(jù)的生存分析,并沒有使用TCGA數(shù)據(jù)庫里面的病人信息,而是自己收集病人樣本,記錄其臨床信息,隨訪時間等等。還采用IHC等病理技術(shù)手段來量化感興趣的基因的表達量情況,最后全部使用自己的數(shù)據(jù)做出來了下面的生存分析曲線。 因為作者并沒有上傳這些臨床信息,所以呢,是不可能重復(fù)出來作者的生存分析曲線啦。不過,我們的學(xué)徒任務(wù)是,去TCGA數(shù)據(jù)庫,找到BRCA和CRC病人的該基因的表達量情況,對病人進行分組后會在生存曲線,看看是否也是具有統(tǒng)計學(xué)顯著。 如果你感興趣研究團隊的數(shù)據(jù)收集過程,也可以繼續(xù)讀文獻: 可以看到病人隊列也不小了,兩個癌癥,每個一百多病人。研究者在檢查STING這個基因表達量的時候,區(qū)分了內(nèi)皮細胞和免疫細胞。這一點很有趣。 只有你對你的課題熟悉到一定程度才知道,并不是TCGA數(shù)據(jù)庫里面的RNA-seq或者芯片數(shù)據(jù)檢測到的STING這個基因表達量能區(qū)分生存就是你的生物學(xué)故事的證據(jù)支持。 臨床資料整理也詳細描述了病理技術(shù)的來龍去脈,使用的儀器和商業(yè)抗體信息。 臨床數(shù)據(jù)統(tǒng)計通常不使用R語言這里值得強調(diào)的是,其實臨床統(tǒng)計數(shù)據(jù)分析并不一定要使用R語言,甚至說,大部分都不會使用R語言完成統(tǒng)計分析。本文就是典型,使用的是收費軟件,PRISM和SPSS。 臨床三線表是必須的這個我以前講解過使用R語言如何繪制 可以根據(jù)臨床信息細分為癌癥亞型后繼續(xù)生存分析因為研究團隊收集的病人臨床信息比較全面,所以可以根據(jù) stage 這個信息,把病人繼續(xù)細分為3個分組后繼續(xù)進行生存分析。 你的作業(yè)就是,使用TCGA數(shù)據(jù)源,制作本文里面的生存分析,看看顯著與否! |
|