在生信技能樹我發(fā)布的GEO數(shù)據(jù)庫挖掘教程也有不少了:目錄:
解讀GEO數(shù)據(jù)存放規(guī)律及下載,一文就夠 解讀SRA數(shù)據(jù)庫規(guī)律一文就夠 從GEO數(shù)據(jù)庫下載得到表達(dá)矩陣 一文就夠 GSEA分析一文就夠(單機(jī)版+R語言版) 根據(jù)分組信息做差異分析- 這個一文不夠的 差異分析得到的結(jié)果注釋一文就夠 通常我都是教大家使用下面的代碼下載任意GEO數(shù)據(jù)庫的數(shù)據(jù)集: options(stringsAsFactors = F) # 注意查看下載文件的大小,檢查數(shù)據(jù) f='GSE76275_eSet.Rdata'
library(GEOquery) # 這個包需要注意兩個配置,一般來說自動化的配置是足夠的。 #Setting options('download.file.method.GEOquery'='auto') #Setting options('GEOquery.inmemory.gpl'=FALSE) if(!file.exists(f)){ gset <- getGEO('GSE76275', destdir=".", AnnotGPL = F, ## 注釋文件 getGPL = F) ## 平臺文件 save(gset,file=f) ## 保存到本地 } load('GSE76275_eSet.Rdata') ## 載入數(shù)據(jù)
但總是有部分大陸的朋友使用起來很困難,錯誤如下: 通常只有的網(wǎng)絡(luò)錯誤,都很詭異,畢竟長城在這里。 解決方式也簡單,加上代碼: options( 'download.file.method.GEOquery' = 'libcurl' ) 即可! 再次運(yùn)行后如下: 修改后就沒有問題啦,下載進(jìn)度條很喜人: 但是,這個時候會引入另外一個問題,如下: 新的問題需要新的解決方案,我們下回再講。
|