基于核標(biāo)記的微生物和大生物分子鑒定徹底改變了我們對(duì)它們的分類學(xué)、系統(tǒng)發(fā)育和生態(tài)學(xué)的理解。如今,對(duì)全球生態(tài)系統(tǒng)中真核生物多樣性的研究嚴(yán)重依賴于核核糖體 RNA (rRNA) 標(biāo)記。今年6月《Database》雜志發(fā)表了一個(gè)新的參考數(shù)據(jù)庫:EUKARYOME,包含所有真核生物(包括后生動(dòng)物(動(dòng)物)、原生動(dòng)物、真菌和植物)的核核糖體 18S rRNA、內(nèi)部轉(zhuǎn)錄間隔(ITS)和 28S rRNA 標(biāo)記。 與其他帶注釋的參考序列數(shù)據(jù)庫相比,該數(shù)據(jù)庫的主要優(yōu)點(diǎn)是它不限于某些分類群,它包括所有rRNA標(biāo)記。EUKARYOME還提供了許多來自(宏)基因組和(宏)條形碼的參考長(zhǎng)讀長(zhǎng)序列,這是一種獨(dú)特的特征,可用于三代長(zhǎng)讀長(zhǎng)高通量測(cè)序數(shù)據(jù)的分類鑒定和嵌合體控制。 參考數(shù)據(jù)集可以從項(xiàng)目主頁以多種格式獲?。?/p> ?? http://www.. EUKARYOME 數(shù)據(jù)庫包括來自多個(gè)參考序列數(shù)據(jù)庫的序列數(shù)據(jù),并獨(dú)特地利用長(zhǎng)reads對(duì)來自 eDNA 的參考序列進(jìn)行分類定位。ITS標(biāo)記中的屬級(jí)信息改善了SSU和LSU的識(shí)別,特別是在rRNA基因分類分辨率低的情況下,或者在特定分類群未對(duì)這些基因進(jìn)行測(cè)序的情況下(例如許多真菌群)。此外,開發(fā)團(tuán)隊(duì)使用可靠的rRNA基因更高級(jí)別的系統(tǒng)發(fā)育定位來解決ITS數(shù)據(jù)子集中從目到界級(jí)別的不確定性。 EUKARYOME 僅采用林奈等級(jí),包括種、屬、科、目、類、門和界。EUKARYOME 參考數(shù)據(jù)庫根據(jù)核 rRNA SSU(150,442 個(gè)reads)、ITS(1,111,297 個(gè)reads)和 LSU(100,197 個(gè)reads)標(biāo)記分別和組合(28,684 個(gè) SSU-ITS-LSU reads)涵蓋了所有陸生和水生真核生物類群。當(dāng)前版本的數(shù)據(jù)庫共包含 1,244,454 個(gè)條目。 其主要優(yōu)勢(shì)在于: 它不局限于某些分類群,而且包括所有 rRNA 標(biāo)記; EUKARYOME 為 SSU、ITS 和 LSU 子集分別或合并編譯了注釋清晰、非冗余、高質(zhì)量的reads,用于高精度分類參考和嵌合體識(shí)別; EUKARYOME 還提供大量參考長(zhǎng)reads序列,這一獨(dú)特功能可用于三代長(zhǎng)讀長(zhǎng)高通量測(cè)序數(shù)據(jù)的分類鑒定和嵌合體控制。 此外,EUKARYOME 以電子表格格式保存,以便快速搜索,并可使用 MS Excel 和其他電子表格程序或文本編輯編程語言的常規(guī)選項(xiàng)更新個(gè)別數(shù)據(jù)字段。 EUKARYOME 還設(shè)置了"Other databases and resources"板塊,整理了其他可用于真核生物研究的數(shù)據(jù)庫及軟件。 | | | 基于ITS區(qū)域,涵蓋所有真核生物,主要關(guān)注真菌 https://unite./ | | 基于ITS區(qū)域,涵蓋所有真核生物,主要關(guān)注真菌 https://www./ | | 包括SSU基因,主要關(guān)注原生生物 https:/// | | 重點(diǎn)研究線蟲的 SSU 基因 https://github.com/WormsEtAl/18SNemaBase | | 關(guān)注動(dòng)物的 COI https:/// | | 真核生物線粒體DNA序列 https://www./ |
與上述數(shù)據(jù)庫相比,EUKARYOME 使用的超長(zhǎng)reads橫跨 SSU、ITS 和 LSU 區(qū)域,這對(duì)于利用超長(zhǎng)reads過濾嵌合體和改進(jìn)鑒定至關(guān)重要。 | | | 具有圖形用戶界面的宏條碼數(shù)據(jù)分析平臺(tái);最適合定制解決方案。 https://pipecraft2-manual./en/latest/ | | 來自 PacBio 測(cè)序儀的全長(zhǎng) ITS 序列的宏條碼數(shù)據(jù)分析管道(也集成在 PipeCraft2 中) https://next-its./ |
| | The Global Soil Mycobiome consortium (GSMc) | 所有真核生物的全球土壤 SSU-V9 + ITS 數(shù)據(jù)集 https://gsmc-fungi./ | | 真菌和類真菌寄生菌生態(tài)特征數(shù)據(jù)庫 https://link./article/10.1007/- s13225-020-00466-2 | | 元數(shù)據(jù)、分類注釋和數(shù)據(jù)管理平臺(tái) https://plutof./ | | 海洋生物群的分類與分級(jí) https://www./ | | 線蟲生態(tài)特征數(shù)據(jù)庫 https://nemys./ | | 所有真核生物的序列和分類資源,重點(diǎn)關(guān)注海洋原生生物 https:/// |
* 建議對(duì)技術(shù)細(xì)節(jié)感興趣的小伙伴請(qǐng)參考文獻(xiàn)原文~對(duì)于文獻(xiàn)整理過程中有翻譯不當(dāng)或錯(cuò)誤也歡迎大家在評(píng)論區(qū)留言指出,互相交流學(xué)習(xí)! >>>>
|