有朋友在后臺(tái)留言讓介紹GSEA分析,那么我們今天就來介紹GSEA分析。 基因集富集分析 (Gene Set Enrichment Analysis, GSEA) 的基本思想是使用預(yù)定義的基因集(通常來自功能注釋或先前實(shí)驗(yàn)的結(jié)果),將基因按照在兩類樣本中的差異表達(dá)程度排序,然后檢驗(yàn)預(yù)先設(shè)定的基因集合是否在這個(gè)排序表的頂端或者底端富集?;蚣细患治鰴z測基因集合而不是單個(gè)基因的表達(dá)變化,因此可以包含這些細(xì)微的表達(dá)變化,預(yù)期得到更為理想的結(jié)果。 從題目中我們看到GSEA分析有三個(gè)特點(diǎn):
看到這里大家可能想起來了RNA-seq或者芯片分析中最為常見的兩種方法:GO(Gene Ontology)和KEGG pathway分析,它們有些相似但又不同。 一般的差異分析(GO和Pathway)往往側(cè)重于比較兩組間的基因表達(dá)差異,集中關(guān)注少數(shù)幾個(gè)顯著上調(diào)或下調(diào)的基因,這容易遺漏部分差異表達(dá)不顯著卻有重要生物學(xué)意義的基因,忽略一些基因的生物特性、基因調(diào)控網(wǎng)絡(luò)之間的關(guān)系及基因功能和意義等有價(jià)值的信息。而GSEA不需要指定明確的差異基因閾值,算法會(huì)根據(jù)實(shí)際數(shù)據(jù)的整體趨勢, 為研究者們提供了一種合理地解決目前芯片分析瓶頸問題的方法,即使在沒有先驗(yàn)經(jīng)驗(yàn)存在的情況下也能在表達(dá)譜整體層次上對(duì)數(shù)條基因進(jìn)行分析,從而從數(shù)理統(tǒng)計(jì)上把表達(dá)譜芯片數(shù)據(jù)與生物學(xué)意義很好地銜接起來,使得研究者們能夠更輕松、更合理地解讀芯片結(jié)果。 目前,市面上絕大多數(shù)公司在求得差異基因列表后,都會(huì)在此之上提供給客戶Pathway 以及GO 富集分析,畢竟給予成百上千的差異表達(dá)基因以簡潔、明晰的生物學(xué)功能的概括,才是進(jìn)行高通量生物學(xué)表達(dá)譜實(shí)驗(yàn)的主要目的。然而,在實(shí)際應(yīng)用于生物學(xué)高通量數(shù)據(jù)時(shí),它們都有一個(gè)重大的缺陷:對(duì)于差異基因檢出的閾值,異常的敏感,客戶需要給出差異基因的一個(gè)明確的定義(閾值),例如abs(FC) ≧2.0 & p ≦ 0.05。這種一刀切的閾值,對(duì)于發(fā)現(xiàn)真正的生物學(xué)效應(yīng),許多時(shí)候是一種障礙,因?yàn)閷?shí)際通過芯片觀測到的RNA 表達(dá)變化,往往是層層的負(fù)反饋調(diào)控后的結(jié)果,并且不同組織對(duì)于表達(dá)差異的敏感度是不同的:在神經(jīng)遞質(zhì)系統(tǒng)內(nèi),一個(gè)1.2 倍的表達(dá)差異即可能產(chǎn)生及其顯著的效應(yīng)。 GSEA富集過程包括三步驟: 1. 計(jì)算富集分?jǐn)?shù)(Enrichment Score); 2. 估計(jì)富集分?jǐn)?shù)的顯著性水平; 3. 矯正多重假設(shè)檢驗(yàn); GSEA的具體原理就不展開了,原理在PNAS文章Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles.Proc Natl Acad Sci U S A. 2005 Oct 25;102(43):15545-50. Epub 2005 Sep 30. (下載鏈接: https://pan.baidu.com/s/1qYeXLBu 密碼: euww) 在分析前我們先看MSigDB數(shù)據(jù)庫,MSigDB(Molecular Signatures Database)數(shù)據(jù)庫中定義了已知的基因集合:http://software./gsea/msigdb
比如細(xì)胞凋亡特征基因集: 這部分包括我們熟悉的KEGG信號(hào)通路等: 我們可以看到MSigDB數(shù)據(jù)收錄的信息還是非常全面的,這個(gè)數(shù)據(jù)庫可以單獨(dú)使用和查詢,我們可以根據(jù)各種條件導(dǎo)出一系列感興趣的gene set。 好了,介紹完MSigDB數(shù)據(jù)庫的基本信息后,我們在(下)篇繼續(xù)。 That's all. Thank you!
|
|