今天實驗室有個師妹問我這個問題,好久不做生信的我想了一會,覺得這個問題對于比較少接觸生信的同學(xué)們來說應(yīng)該比較費腦筋。借此,我簡單說一下,詳細(xì)的可以自行百度~ GSEA:即基因探針富集分析,是通過基礎(chǔ)知識來揭示基因組表達數(shù)據(jù)的一種方法。 簡單來說它可以以KEGG數(shù)據(jù)庫(或其他基因注釋數(shù)據(jù)庫,例如GO)為背景,根據(jù)所選樣品所有的基因表達量來做富集分析,得到的結(jié)果是所有表達的基因在各個代謝通路中的富集情況。 KEGG:KEGG 是了解高級功能和生物系統(tǒng)(如細(xì)胞、 生物和生態(tài)系統(tǒng)),從分子水平信息,尤其是大型分子數(shù)據(jù)集生成的基因組測序和其他高通量實驗技術(shù)的實用程序數(shù)據(jù)庫資源。 我們通常用這個數(shù)據(jù)庫做代謝通路富集分析(kegg pathway富集分析),主要算法是先挑選出顯著差異表達的基因,然后利用超幾何分布等統(tǒng)計算法根據(jù)通路的差異基因數(shù)目計算該通路是否顯著的P值(一般還要校驗得到Q值),根據(jù)Q值由小到大排序即得到顯著程度。 說白了,GSEA的輸入變量是基因表達量,KEGG pathway富集分析的輸入變量是基因列表;二者都能篩選出顯著富集的通路,區(qū)別是GSEA針對所有基因,KEGG針對差異基因富集的通路,現(xiàn)在一般結(jié)合兩者的結(jié)果來做推斷。 以上是我的個人理解,也沒有詳細(xì)查資料,如需詳細(xì)了解,還請入木三分~~O(∩_∩)O |
|