小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

宏基因組分析專題(5):從宏基因組數(shù)據(jù)中得到高質(zhì)量的基因組數(shù)據(jù)- MetaBAT的安裝和使用

 微生態(tài) 2021-09-04

生科云網(wǎng)址:https://www.


本文由微科盟phage根據(jù)實(shí)踐經(jīng)驗(yàn)而整理,希望對(duì)大家有幫助。

微科盟原創(chuàng)微文,歡迎轉(zhuǎn)發(fā)轉(zhuǎn)載,轉(zhuǎn)載須注明來(lái)源《微生態(tài)》公眾號(hào)

寫在前面

宏基因組分箱(Binning)是將宏基因組測(cè)序得到的混合了不同微生物的序列reads或序列組裝得到的contigs或scaffolds按物種分開歸類的過(guò)程。這些分開歸類的序列被稱為宏基因組組裝基因組(metagenome-assembled genomes,MAGs)。
在宏基因組分析中,往往需要在宏基因組數(shù)據(jù)中重建某個(gè)單個(gè)的生物的基因組來(lái)進(jìn)行進(jìn)一步研究,其中代表性的分箱工具為Maxbin和MetaBAT。一般來(lái)說(shuō)宏基因組分箱的基本原理是通過(guò)四核苷酸頻率(tetranucleotide frequency),GC含量和必需的單拷貝基因等的不同來(lái)區(qū)分不同的基因組。具體的算法參照以下網(wǎng)址:MetaBAT(https:///articles/7359/),Maxbin(https://academic./bioinformatics/article-abstract/32/4/605/1744462)。
兩款軟件都是宏基因組分箱權(quán)威軟件,本文將重點(diǎn)介紹MetaBAT的安裝和使用。下圖為MetaBAT的pepline,首先將不同來(lái)源的基因組,在二代測(cè)序后并進(jìn)行組裝,將測(cè)序的reads比對(duì)到組裝的contigs上,通過(guò)MetaBAT軟件計(jì)算contig的四核苷酸頻率(TDP),計(jì)算所有樣本的豐度距離概率 (ADP),組合每個(gè)contigs的TDP和ADP,對(duì)這些contigs結(jié)果距離形成一個(gè)距離矩陣,通過(guò)在距離矩陣中迭代和窮舉來(lái)得到每一個(gè)bin。MetaBAT2 在MetaBAT的基礎(chǔ)上使用了全新的算法,提高了分箱的準(zhǔn)確度。

圖1

安裝和使用

一、MetaBAT的安裝和使用

參考官方文檔:

https:///berkeleylab/metabat/issues?status=new&status=open

1.1 安裝前準(zhǔn)備

要保證自己的linux系統(tǒng)相關(guān)的軟件版本達(dá)到安裝要求

gcc/g++ >= 4.9

boost >= 1.53

cmake >= 3.8.2

make >= 4.1

可以輸入conda update –all 升級(jí)所有的軟件包。

1.2 開始安裝

git clone https:///berkeleylab/metabat.git  #下載安裝包

cd metabat    

mkdir build

cd build

cmake -DCMAKE_INSTALL_PREFIX=$HOME/metabat ..

make   #編譯

make install

cd ..

rm -rf build

1.3 報(bào)錯(cuò)解決

筆者在軟件編譯 (make) 這一步的時(shí)候出現(xiàn)了這樣一個(gè)報(bào)錯(cuò)

圖2

可以看到報(bào)錯(cuò)信息為antoheader沒(méi)有找到,解決方法如下:

sudo apt-get install autoconf

我們?cè)诮鉀Q安裝報(bào)錯(cuò)的時(shí)候一定要認(rèn)真看系統(tǒng)反饋的報(bào)錯(cuò)信息才能更好的解決,當(dāng)編譯到100%的時(shí)候及編譯成功。

圖3


1.4 將MetaBAT加入到環(huán)境變量中

當(dāng)安裝成功時(shí)候,首先得把軟件加入到環(huán)境變量中

export PATH=$PATH:$pwd #把當(dāng)前目錄加到環(huán)境變量中這只是臨時(shí)的生效,永久生效請(qǐng)修改bashrc文件

二、運(yùn)行MetaBAT

2.1 數(shù)據(jù)準(zhǔn)備

使用SRR1976948_1.fastq.gz,SRR1976948_2.fastq.gz 以及在上節(jié)通過(guò)megahit拼接的contig.fa文件

ln -s /mnt/f/微生態(tài)/*.gz #把文件軟鏈接到我的當(dāng)前工作文件夾 

2.2 依賴軟件安裝

MetaBAT的運(yùn)行依賴bowtie2 Samtools 等軟件

conda Install bowtie2

conda install samtools

2.3 使用bowtie建立索引文件

bowtie2-build -f contigs.fa contig --threads 2

2.4 建立比對(duì)

bowtie2 -1 SRR1976948_1.fastq.gz -2 SRR1976948_2.fastq.gz -p 2 -x

 final -S contig.sam

2.5 將sam文件轉(zhuǎn)換成bam文件

samtools view -@ 2 -b -S contig.sam -o contig.bam

2.6 對(duì)bam文件進(jìn)行排序

samtools sort -@ 2 -l 9 -O BAM contig.bam -o contig.sorted.bam

2.7 計(jì)算contig的深度

jgi_summarize_bam_contig_depths --outputDepth contig.depth.txt contig.sorted.bam

2.8 開始分箱

metabat2 -m 1500 -t 2 -i contigs.fa -a contig.depth.txt -o all -v

三、在線的宏基因組分析網(wǎng)站

由于MetaBAT運(yùn)行時(shí)間比較長(zhǎng),且筆者的筆記本電腦性能太差了,因此筆者這里就不展示用虛擬機(jī)跑出來(lái)的結(jié)果了,這里可以再安利兩個(gè)在線的可以做宏基因組分析的網(wǎng)站:一個(gè)是國(guó)內(nèi)的國(guó)家微生物科學(xué)中心(https://,圖4),另一個(gè)是國(guó)外的Kbase網(wǎng)站(https://narrative./,圖5)。在這兩個(gè)網(wǎng)站注冊(cè)后就可以進(jìn)行宏基因組一些基本的分析,對(duì)沒(méi)有Linux基礎(chǔ)的和沒(méi)有服務(wù)器的同學(xué)可以做一些簡(jiǎn)單的分析。

圖4

圖5

3.1 在kbase上進(jìn)行宏基因組分析
下面來(lái)簡(jiǎn)單介紹下kbase里面的Metabat的使用。Kbase的使用非常簡(jiǎn)單,找到MetaBAT2后有三個(gè)需要填寫的選項(xiàng),第一個(gè)選擇你組裝的contigs,第二個(gè)選擇你的原始測(cè)序的fastq文件,第三個(gè)填寫下輸出文件的名稱,點(diǎn)擊左上角的run即可運(yùn)行。

圖6

這是通過(guò)kbase網(wǎng)站得到的結(jié)果可以看到共分出8個(gè)bins

圖7

四、寫在最后
在本節(jié)中,通過(guò)MetaBAT對(duì)宏基因組進(jìn)行了分箱操作,雖然得到了很多了bins,但是這些分箱得到的bins的質(zhì)量還是未知的。在下一節(jié)中將會(huì)介紹使用CheckM對(duì)宏基因組分箱的bins進(jìn)行質(zhì)量評(píng)估。

本文來(lái)源于微科盟原創(chuàng)作者phage,僅用于學(xué)術(shù)分享,如有侵權(quán),請(qǐng)聯(lián)系刪除!


    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多