小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

可能是最出名的TCGA表達(dá)分析數(shù)據(jù)庫(kù)(二)

 醫(yī)學(xué)數(shù)據(jù)庫(kù)百科 2021-01-08



有小伙伴說(shuō)想知道GEPIA數(shù)據(jù)庫(kù)的用法。正好最近一段時(shí)間GEPIA2更新了,其中也更新了一些新的功能。所以就趁著這個(gè)機(jī)會(huì)給大家介紹一下GEPIA2吧。昨天我們介紹了其中一部分,這里我們來(lái)說(shuō)一下后面的一些功能。

1

預(yù)后分析

如果要查看一個(gè)基因的預(yù)后,可以通過(guò)這個(gè)功能來(lái)查看。新版的預(yù)后分析添加了一些新的選擇,這里我們就簡(jiǎn)單的介紹一下。
  • 基因輸入方面:我們可以輸入一個(gè)基因,也可以輸入一系列的基因。如果是一系列的基因,我們可以理解為這一系列基因都和某一個(gè)表型有關(guān),通過(guò)這一系列基因的表達(dá),來(lái)代表這個(gè)表型的表達(dá)。例如我們輸入:CCR7,SELL,IL7R。這三個(gè)基因來(lái)代表Central memory T cell。對(duì)于這種基因代表表型的方法,最好的整合方法還是GSVA的算法。但是由于那個(gè)計(jì)算量比較慢,所以GEPIA2采用了這幾個(gè)基因表達(dá)(log(TPM + 1))的均值來(lái)代表表型,這個(gè)也是能反映一些內(nèi)容的吧。

  • 預(yù)后分析分組方面:GEPIA2 提供了三種方式,中位值、四分位數(shù)以及自定義。由于基因在進(jìn)行 KM 預(yù)后分析的時(shí)候,是分為兩組。第一步是對(duì)相關(guān)觀察的變量進(jìn)行分組。一般來(lái)說(shuō),是基于中位值平均分成高低表達(dá)兩組,分別代表高表達(dá)和低表達(dá);第二步才是進(jìn)行預(yù)后分析。

    但是對(duì)于分組而言,沒(méi)有一個(gè)人為的規(guī)定說(shuō)具體怎么分組好,中位置沒(méi)有意義怎么辦呢?那其實(shí)還有兩種方法可以繼續(xù)看一下的,
    1. 在進(jìn)行基因分組的時(shí)候,不用中位置來(lái)進(jìn)行區(qū)分。而已使用表達(dá)的前X%(例如25%)作為高表達(dá)組,然后后X%(25%)作為低表達(dá)組。這樣再看這兩組預(yù)后有沒(méi)有意義。這個(gè)就是數(shù)據(jù)庫(kù)使用四分位數(shù)分析的方法。

    2. 還有一種方法這個(gè)數(shù)據(jù)庫(kù)實(shí)現(xiàn)不了,不過(guò)可以介紹一下。這個(gè)方法也可以叫 best spearation,類(lèi)似于窮舉法。我們把基因表達(dá)每一個(gè)值都當(dāng)作一個(gè)界限值來(lái)進(jìn)行分組,然后看各個(gè)分組的預(yù)后有沒(méi)有意義,在所有分組分析的結(jié)果當(dāng)中選擇最佳的當(dāng)作最佳的分組,這種統(tǒng)計(jì)方法叫做最大選擇秩統(tǒng)計(jì)量感興趣的可以查一下。

 其他的就是常規(guī)的數(shù)據(jù)庫(kù)的選擇方式了,這里我們就不介紹了。數(shù)據(jù)庫(kù)提供了三種結(jié)果呈現(xiàn)

  1. 單一基因的預(yù)后分析圖

  1. 某一個(gè)腫瘤預(yù)后最有意義的基因

  1. 某幾個(gè)基因在不同腫瘤當(dāng)中的預(yù)后HR結(jié)果比較

2

基因異構(gòu)體表達(dá)分析


基因在形成mRNA的時(shí)候,由于可變剪切的存在,就形成了不同的異構(gòu)體。所以對(duì)于不同的異構(gòu)體,其表達(dá)量可能是不一樣的。在這一部分我們可以查看一個(gè)基因不同異構(gòu)體的表達(dá)水平。
  1. 我們可以查看某一個(gè)基因異構(gòu)體在不同腫瘤當(dāng)中的差異趨勢(shì)

  1. 查看基因異構(gòu)體的具體區(qū)別

3

基因之間的相關(guān)分析


如果我們想看兩個(gè)基因之間的相關(guān)性,可以通過(guò)這個(gè)部分來(lái)查看的。我們需要做的就是輸入想要查看的兩個(gè)基因,同時(shí)選擇分析方法。
對(duì)于相關(guān)分析的分析方法,目前也就是三種: Pearson,Spearman 和 Kendall。這三種方法簡(jiǎn)單的應(yīng)用區(qū)分如下:
  • 如果數(shù)據(jù)是一個(gè)連續(xù)正態(tài)分布的那,就使用 Pearson

  • 如果數(shù)據(jù)是連續(xù)性變量但不符合正態(tài)分布的時(shí)候,就使用 Spearman

  • 如果數(shù)據(jù)是等級(jí)資料的時(shí)候,就使用 Kendall

由于我們的表達(dá)數(shù)據(jù)不存在等級(jí)的說(shuō)法,所以 Kendall 是不需要的。對(duì)于TPM的數(shù)據(jù),一般來(lái)說(shuō)都是偏態(tài)的,而通過(guò)log2(TPM + 1)轉(zhuǎn)換之后,有的可能會(huì)變成偏向正態(tài)的。所以這也是數(shù)據(jù)庫(kù)在計(jì)算相關(guān)的時(shí)候默認(rèn)使用的是Pearson。但是有時(shí)候數(shù)據(jù)就算轉(zhuǎn)換了,有可能也是偏態(tài)的,所以這個(gè)時(shí)候可以使用Spearman分析一下看看。
結(jié)果呈現(xiàn),就是一個(gè)相關(guān)分析的圖:

3

降維分析


我們?cè)谶M(jìn)行多維度分析的時(shí)候,都會(huì)通過(guò)降維分析來(lái)查看,具體的具體影響因子可能是什么。常規(guī)的降維分析就是PCA(主成分分析了)。這個(gè)數(shù)據(jù)庫(kù)提過(guò)了,我們輸入目標(biāo)基因來(lái)查看降維結(jié)果的界面。進(jìn)而評(píng)價(jià),這幾個(gè)目標(biāo)基因能不能把用來(lái)區(qū)分不同的分組。
如果對(duì)于主成分分析不了解的話,推薦 STATQUEST 對(duì)于PCA的講解(bilibiliID: BV1T4411T73S)
 結(jié)果呈現(xiàn),首先是一個(gè)柱狀圖來(lái)說(shuō)不同成分對(duì)于變異度解釋的程度。

另外還提供了,主成分分析的散點(diǎn)圖。數(shù)據(jù)庫(kù)提供了三維的主成分分析的圖,由于小編不喜歡三維圖形(區(qū)分度太差了),所以就只放一個(gè)2D的了。

數(shù)據(jù)庫(kù)總結(jié)


關(guān)于GEPIA2的的應(yīng)用就是這些了,中間我們?cè)诿恳粋€(gè)分析方式當(dāng)中添加了一部分少量的方法講解。如果有檢索目標(biāo),想看一下在某一個(gè)基因在 TCG當(dāng)中的表達(dá)關(guān)系的話,利用GEPIA來(lái)進(jìn)行查找還是一個(gè)快速的方法的。另外如果想要看多組學(xué)交叉分析的結(jié)果的話,這個(gè)就沒(méi)辦法,就改天給大家介紹多組學(xué)交叉分析的數(shù)據(jù)庫(kù)吧。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類(lèi)似文章 更多