相信GEO(Gene Expression Omnibus)數(shù)據(jù)庫大家應(yīng)該都不陌生,小編前面也通過三期視頻詳細(xì)的介紹過這個(gè)公共數(shù)據(jù)庫,以及如何在GEO里面檢索相關(guān)的數(shù)據(jù)。 ?GEO數(shù)據(jù)庫數(shù)據(jù)檢索方法(一) ?GEO數(shù)據(jù)庫數(shù)據(jù)檢索方法(二) ?GEO數(shù)據(jù)庫數(shù)據(jù)頁面介紹(三) 在GEO數(shù)據(jù)庫里面收錄了各種各樣的數(shù)據(jù),不僅有芯片數(shù)據(jù)也有測序數(shù)據(jù)。不僅有DNA數(shù)據(jù),表達(dá)譜數(shù)據(jù),也有甲基化數(shù)據(jù)和chip-seq的數(shù)據(jù)。對于表達(dá)譜數(shù)據(jù)來說,一般第一步我們都會去做差異表達(dá)分析,去尋找在不同狀態(tài)下表達(dá)值存在顯著差異的基因,然后基于這些差異表達(dá)的基因再去做一些下游的分析。前面小編也給大家介紹過一些基于TCGA做差異表達(dá)分析的方法 那么對于GEO里面的芯片數(shù)據(jù),我們也可以通過零代碼的方式和R代碼的方式來分析。今天小編就給大家介紹一下如何使用GEO數(shù)據(jù)庫自帶的工具GEO2R來零代碼做差異表達(dá)分析。 1.首先我們打開GEO(https://www.ncbi.nlm./)的網(wǎng)站,通過上面視頻里面講到的方法來檢索自己感興趣的數(shù)據(jù),這里檢索的是黑色素瘤里面敏感還耐藥相關(guān)的數(shù)據(jù) 我們以下面這套數(shù)據(jù)為例 2.設(shè)置樣本分組 點(diǎn)擊了Analyze with GEO2R之后就會跳轉(zhuǎn)到下面的頁面,這個(gè)時(shí)候我們就可以點(diǎn)擊Define groups開始設(shè)置分組信息了,先輸入一個(gè)sensitive組。 然后再輸入一個(gè)resistant組 3.將樣本劃分到相應(yīng)的分組 按住ctrl,選中三個(gè)sensitive的樣本,點(diǎn)擊分組里面的sensitive標(biāo)簽,這個(gè)時(shí)候就會顯示這個(gè)分組里面有三個(gè)樣本 同樣的方法,我們可以選中剩下的四個(gè)樣本,點(diǎn)擊resistant標(biāo)簽 4.點(diǎn)擊Analyze做差異表達(dá)分析 5.查看并下載結(jié)果 可以點(diǎn)擊圖片查看火山圖,venn圖,箱形圖等等。 完整的差異表達(dá)的結(jié)果可以通過點(diǎn)擊Download full table 獲取。 可能有些小伙伴發(fā)現(xiàn)這個(gè)表里面沒有基因的名字,這個(gè)就很尷尬了。不要慌,其實(shí)在Download full table邊上還有一個(gè)Select columns,可以選擇需要包含在表里面的信息 我們可以根據(jù)自己的需求,選擇需要包含的信息,如果勾選symbol就會在最后的表格里面包含基因名字了。選好之后,點(diǎn)擊set就OK了。 下面是更改之后的表格 為了方便大家交流學(xué)習(xí),共同進(jìn)步,我特地創(chuàng)建了微信交流群 |
|