有小伙伴說(shuō)想知道GEPIA數(shù)據(jù)庫(kù)的用法。正好最近一段時(shí)間GEPIA2更新了,其中也更新了一些新的功能。所以就趁著這個(gè)機(jī)會(huì)給大家介紹一下GEPIA2吧。昨天我們介紹了其中一部分,這里我們來(lái)說(shuō)一下后面的一些功能。如果要查看一個(gè)基因的預(yù)后,可以通過(guò)這個(gè)功能來(lái)查看。新版的預(yù)后分析添加了一些新的選擇,這里我們就簡(jiǎn)單的介紹一下。
在進(jìn)行基因分組的時(shí)候,不用中位置來(lái)進(jìn)行區(qū)分。而已使用表達(dá)的前X%(例如25%)作為高表達(dá)組,然后后X%(25%)作為低表達(dá)組。這樣再看這兩組預(yù)后有沒(méi)有意義。這個(gè)就是數(shù)據(jù)庫(kù)使用四分位數(shù)分析的方法。 還有一種方法這個(gè)數(shù)據(jù)庫(kù)實(shí)現(xiàn)不了,不過(guò)可以介紹一下。這個(gè)方法也可以叫 best spearation,類(lèi)似于窮舉法。我們把基因表達(dá)每一個(gè)值都當(dāng)作一個(gè)界限值來(lái)進(jìn)行分組,然后看各個(gè)分組的預(yù)后有沒(méi)有意義,在所有分組分析的結(jié)果當(dāng)中選擇最佳的當(dāng)作最佳的分組,這種統(tǒng)計(jì)方法叫做最大選擇秩統(tǒng)計(jì)量。感興趣的可以查一下。
其他的就是常規(guī)的數(shù)據(jù)庫(kù)的選擇方式了,這里我們就不介紹了。數(shù)據(jù)庫(kù)提供了三種結(jié)果呈現(xiàn) 單一基因的預(yù)后分析圖
某一個(gè)腫瘤預(yù)后最有意義的基因
某幾個(gè)基因在不同腫瘤當(dāng)中的預(yù)后HR結(jié)果比較
基因在形成mRNA的時(shí)候,由于可變剪切的存在,就形成了不同的異構(gòu)體。所以對(duì)于不同的異構(gòu)體,其表達(dá)量可能是不一樣的。在這一部分我們可以查看一個(gè)基因不同異構(gòu)體的表達(dá)水平。
我們可以查看某一個(gè)基因異構(gòu)體在不同腫瘤當(dāng)中的差異趨勢(shì)
查看基因異構(gòu)體的具體區(qū)別
如果我們想看兩個(gè)基因之間的相關(guān)性,可以通過(guò)這個(gè)部分來(lái)查看的。我們需要做的就是輸入想要查看的兩個(gè)基因,同時(shí)選擇分析方法。對(duì)于相關(guān)分析的分析方法,目前也就是三種: Pearson,Spearman 和 Kendall。這三種方法簡(jiǎn)單的應(yīng)用區(qū)分如下:如果數(shù)據(jù)是一個(gè)連續(xù)正態(tài)分布的那,就使用 Pearson 如果數(shù)據(jù)是連續(xù)性變量但不符合正態(tài)分布的時(shí)候,就使用 Spearman 如果數(shù)據(jù)是等級(jí)資料的時(shí)候,就使用 Kendall 由于我們的表達(dá)數(shù)據(jù)不存在等級(jí)的說(shuō)法,所以 Kendall 是不需要的。對(duì)于TPM的數(shù)據(jù),一般來(lái)說(shuō)都是偏態(tài)的,而通過(guò)log2(TPM + 1)轉(zhuǎn)換之后,有的可能會(huì)變成偏向正態(tài)的。所以這也是數(shù)據(jù)庫(kù)在計(jì)算相關(guān)的時(shí)候默認(rèn)使用的是Pearson。但是有時(shí)候數(shù)據(jù)就算轉(zhuǎn)換了,有可能也是偏態(tài)的,所以這個(gè)時(shí)候可以使用Spearman分析一下看看。結(jié)果呈現(xiàn),就是一個(gè)相關(guān)分析的圖: 我們?cè)谶M(jìn)行多維度分析的時(shí)候,都會(huì)通過(guò)降維分析來(lái)查看,具體的具體影響因子可能是什么。常規(guī)的降維分析就是PCA(主成分分析了)。這個(gè)數(shù)據(jù)庫(kù)提過(guò)了,我們輸入目標(biāo)基因來(lái)查看降維結(jié)果的界面。進(jìn)而評(píng)價(jià),這幾個(gè)目標(biāo)基因能不能把用來(lái)區(qū)分不同的分組。 如果對(duì)于主成分分析不了解的話,推薦 STATQUEST 對(duì)于PCA的講解(bilibiliID: BV1T4411T73S) 結(jié)果呈現(xiàn),首先是一個(gè)柱狀圖來(lái)說(shuō)不同成分對(duì)于變異度解釋的程度。 另外還提供了,主成分分析的散點(diǎn)圖。數(shù)據(jù)庫(kù)提供了三維的主成分分析的圖,由于小編不喜歡三維圖形(區(qū)分度太差了),所以就只放一個(gè)2D的了。
關(guān)于GEPIA2的的應(yīng)用就是這些了,中間我們?cè)诿恳粋€(gè)分析方式當(dāng)中添加了一部分少量的方法講解。如果有檢索目標(biāo),想看一下在某一個(gè)基因在 TCGA 當(dāng)中的表達(dá)關(guān)系的話,利用GEPIA來(lái)進(jìn)行查找還是一個(gè)快速的方法的。另外如果想要看多組學(xué)交叉分析的結(jié)果的話,這個(gè)就沒(méi)辦法看了,就改天給大家介紹多組學(xué)交叉分析的數(shù)據(jù)庫(kù)吧。
|