小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

FastqC結(jié)果簡(jiǎn)介

 生物_醫(yī)藥_科研 2019-01-10
拿到原始數(shù)據(jù)后我們采用fastqC程序進(jìn)行質(zhì)控,看原始數(shù)據(jù)質(zhì)量情況,fastqC會(huì)生成一個(gè)html結(jié)果報(bào)告,根據(jù)圖形化界面,我們可以判斷下機(jī)數(shù)據(jù)情況是否符合分析要求,fastqC總結(jié)結(jié)果如下:
這里寫(xiě)圖片描述
FastqC有3種結(jié)果:綠色代表PASS;黃色代表WARN;紅色代表FAIL。當(dāng)出現(xiàn)黃色時(shí)說(shuō)明需要查看結(jié)果。
Basic statistics是該fastq一些基本信息,主要有
這里寫(xiě)圖片描述
Filename:文件名
File type: 文件類(lèi)型
Encoding:測(cè)序平臺(tái)的版本和相應(yīng)的編碼版本號(hào),用于計(jì)算Phred反推error P時(shí)用
Total Sequences: 輸入文本的reads的數(shù)量
Sequence length: 測(cè)序長(zhǎng)度
%GC: GC含量,表示整體序列的GC含量,由于二代測(cè)序GC偏好性高,且深度越高,GC含量會(huì)越高。
這里寫(xiě)圖片描述
橫軸為read長(zhǎng)度,縱軸為質(zhì)量得分,Q = -10*log10(error P)。
柱狀表示該位置所有序列的測(cè)序質(zhì)量的統(tǒng)計(jì),柱狀是25%~75%區(qū)間質(zhì)量分布,error bar是10%~90%區(qū)間質(zhì)量分布,藍(lán)線表示平均數(shù)。一般要求所有位置的10%分位數(shù)大于20,即大于最多允許該位置10%的序列低于Q20。當(dāng)任何堿基質(zhì)量低于10,或者任何中位數(shù)低于25報(bào)WARN,需注意;當(dāng)任何堿基質(zhì)量低于5或者任何中位數(shù)低于20報(bào)FAIL。
這里寫(xiě)圖片描述
每個(gè)tail測(cè)序情況,橫軸表示堿基位置,縱軸表示tail的index編號(hào),這個(gè)圖主要是為了防止在測(cè)序過(guò)程中某些tail受到不可控因素的影響而出現(xiàn)測(cè)序質(zhì)量偏低,藍(lán)色表示測(cè)序質(zhì)量很高,暖色表示測(cè)序質(zhì)量不高。當(dāng)某些tail出現(xiàn)暖色,在后續(xù)的分析種把該tail測(cè)序結(jié)果全部去除。
這里寫(xiě)圖片描述
橫軸表示Q值,縱軸表示每個(gè)值對(duì)應(yīng)的read數(shù)目,當(dāng)測(cè)序結(jié)果主要集中在高分中,證明測(cè)序質(zhì)量良好。
這里寫(xiě)圖片描述
橫軸為堿基長(zhǎng)度分布,縱軸表示百分比,圖中4條線分別代表A,C,T,G在每個(gè)位置上的平均含量。由于測(cè)序平臺(tái)及測(cè)序長(zhǎng)度不同,以及測(cè)序儀開(kāi)始狀態(tài)不穩(wěn)定經(jīng)常出現(xiàn)前后波動(dòng)情況。
這里寫(xiě)圖片描述
橫軸表示GC含量,縱軸表示不同GC含量對(duì)應(yīng)的read數(shù),藍(lán)色為程序根據(jù)經(jīng)驗(yàn)分布給出的理論值,紅色是真實(shí)值,當(dāng)紅色出現(xiàn)雙峰是表示混入了其他DNA序列。。
這里寫(xiě)圖片描述
當(dāng)出現(xiàn)測(cè)序儀不能分辨的堿基時(shí)會(huì)產(chǎn)生N,橫軸為堿基分布,縱軸為N比率,當(dāng)任一位置N的比率超過(guò)5%報(bào)WARN,超過(guò)20%報(bào)FAIL。
這里寫(xiě)圖片描述
理論上每次測(cè)序儀測(cè)出的read長(zhǎng)度時(shí)一致的,但是由于建庫(kù)等因素通常會(huì)導(dǎo)致一些小片段,如果報(bào)FAIL,表明此次測(cè)序過(guò)程中產(chǎn)生的數(shù)據(jù)不可信。
這里寫(xiě)圖片描述
統(tǒng)計(jì)序列完全一致的reads的頻率,橫軸表示重復(fù)的次數(shù),縱軸表示重復(fù)的reads的數(shù)目。一般測(cè)序深度越高,越容易產(chǎn)生一定程度的重復(fù)序列。
這里寫(xiě)圖片描述
當(dāng)有某個(gè)序列大量出現(xiàn)時(shí),超過(guò)總reads數(shù)的0.1%時(shí)報(bào)WARN,超過(guò)1%時(shí)報(bào)FAIL。
這里寫(xiě)圖片描述
橫軸表示堿基位置,縱軸表示百分比。當(dāng)fastqc分析時(shí)沒(méi)有選擇參數(shù)-a adapter list時(shí),默認(rèn)使用圖例中的4種通用adapter序列進(jìn)行統(tǒng)計(jì)。若有adapter殘留,后續(xù)必須去接頭。
這里寫(xiě)圖片描述
重復(fù)短序列出現(xiàn)的次數(shù),出現(xiàn)上圖這種情況的原因要么是序列本身重復(fù)度高,比如建庫(kù)PCR的時(shí)候出現(xiàn)了Bias?;蛘遖dapter沒(méi)有除干凈。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多