1.測序結(jié)果文件
一般公司DNA測序結(jié)果都提供兩個文檔,一個是序列文檔(后綴為.seq),一個是測序峰圖文檔(后綴.ab1),為堿基的測序質(zhì)量信息。
(A).seq – 序列文件,TEXT的序列文檔,可由記事本或BioEdit打開。
(B).ab1-峰圖文件,可由BioEdit或Chromas打開察看。
2.切除兩端低質(zhì)量堿基
由于Sanger測序技術(shù)限制,每個測序反應(yīng)一般僅有800bp左右比較準確。
一般測序結(jié)果的前端大約50個堿基的質(zhì)量會不好(測序引物的原因),此部分測序峰圖通常無法判讀。這是正?,F(xiàn)象,需要把此部分堿基切除。同理,測序后期的堿基質(zhì)量也比較差(酶活降低與雜質(zhì)干擾較大等原因),也需要把尾部測序峰圖不規(guī)則的堿基切除。因此留下中間堿基質(zhì)量相對較好(峰圖規(guī)則)的序列用于后續(xù)分析。
方法如下:
用 BioEdit 打開正向測序結(jié)果峰圖文件( ZB10100433 (yangpin1) 16SS(zidai)_Pw_G12.ab1),通過移動左邊與左上角的比例標尺,調(diào)整峰圖的高度與寬度,使DNA每個堿基的峰圖大小適合觀察。
從下圖看出,前面50多個堿基的峰較亂,此處選擇55個開始的堿基。同理,DNA末端由于酶活力下降等原因,測序質(zhì)量也逐步變差。根據(jù)峰圖的形狀,我們也需要切除尾部950bp后的堿基(約末端100bp),只保留56-950之間約900bp的高質(zhì)量堿基。
選擇 BioEdit 顯示DNA序列的子窗口(Window菜單->DNA sequence frome…)
然后在 BioEdit 的Sequence菜單->select positions,在彈出窗口中輸入56與950,點OK按鈕后,就以背景黑的顯示已選擇的序列。
再選edit菜單->Copy(或直接按Ctrl-C鍵),復(fù)制序列到一個新的文本文件,保存為16S_rDNA.fas。增加序列的注釋行”>16SF”,代表正向測序序列。
同上步驟,根據(jù)峰圖信息,再復(fù)制另一個反向測序結(jié)果的高質(zhì)量序列(56-950)到文本文件16S_rDNA.fas,并標記序列為”>16SR”,代表反向測序序列。
DNA測序通常需要兩個方向進行,測序都是從DNA的5’端到3’端進行的,正向和反向測序是指對DNA的兩條互補鏈分別測序。雙向測序結(jié)果經(jīng)校讀后完全一致才能認為得到可靠DNA測序結(jié)果。
3.雙向測序序列的合并
通常PCR產(chǎn)物雙向測序,需要合并雙向序列,最終得到全長序列,這樣得到DNA序列比較準確。
Bioedit打開前面保存的16S_rDNA.fas。
由于第二條序列是反向測序得到的DNA反向互補序列,需要通過先得到DNA的反向互補序列:Sequence->Nuleic Acid->Reverse Complement,再進行比對。
利用BioEdit的alignment功能找重疊區(qū)域:Accessory application->ClustalW multiple alignment,使用默認設(shè)置,比對結(jié)果顯示,中間重疊部分的序列大部分相似。
如果重疊區(qū)不是大部分相同堿基,請試著把一條序列反向互補,再比對。
4.堿基的校準
在上一步的比對結(jié)果窗口,先利用BioEdit得到兩條件序列合并后的一致序列:
修改堿基前,需要先把bioedit的Mode設(shè)置為”Edit”與”Insert”,并選中按鈕”view conservation plotting identities […] with a dot”,以點顯示相同的堿基,便于觀察差異位點。
在BioEdit中打開正向和反向測序結(jié)果的AB1文件和上面比對結(jié)果放同一窗戶(如圖)。
定位到差異堿基的位置(下圖黑色部分),一般可以在峰圖文件中查找不一致堿基(正反鏈錯配、缺失或誤增堿基)及附近的幾個序列(點擊Edit菜單->find,或直接Ctrl-F),如查找GCAtAC。
注意反向測序峰圖的搜索,需要輸入序列的反向互補序列(GTtTGC),小寫字母為不一致堿基。
查看該堿基及附近堿基正反測序峰圖形狀,判斷該堿基正確的堿基序列。
然后在序列窗口中分別改正正向16SF、反向16SR及Consensus序列中不一致的堿基。如有空格(gap)顯示為”-“,需要把三條序列同一位置上的堿基與”-“都刪除,才能保持后面的堿基比對結(jié)果正常(Backspace可刪除光標前一個堿基)。
在BioEdit中打開正向和反向測序結(jié)果的AB1文件和上面比對結(jié)果放同一窗戶(如
5.保存序列
保存校正后的consensus序列,即為最終測序結(jié)果的合并序列。
選擇concensus序列->鼠標右鍵:copy sequences
點擊file菜單->新建Aligment
點擊Edit菜單->paste sequence,并點擊concensus的標題改為”16S_rDNA”
然后保存為16S_rDNA.fas(文件類型選擇Fasta格式)