小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

NGS 測序十年記:從第一臺測序儀的誕生到后起之秀 PacBio

 elabman 2015-12-03



第一臺測序儀的誕生




從 454 生命科學推出第一臺新一代測序儀以來,一晃十年過去了。這十年,正是基因組學高速發(fā)展的十年。我們看到了新儀器接踵而至,也看到了新技術(shù)不斷問世,讓人腦洞大開。從當初耗資 30 億美元的人類基因組計劃,到如今 1000 美元的人類基因組,測序技術(shù)經(jīng)歷了怎樣的發(fā)展?我們在此作一回顧。


454 生命科學(454 Life Sciences)可謂新一代測序技術(shù)的奠基人。它的創(chuàng)始人是生物界的傳奇人士:Jonathan Rothberg。正如蘋果砸牛頓一樣,任何發(fā)明創(chuàng)造的背后都有個故事。Rothberg 的版本是這樣的。當年,他的兒子一出生,就被送進嬰兒特別護理病房接受治療,那時 Rothberg 整天都在擔心自己的孩子會不會天生有什么問題。于是,他下定決心要開發(fā)一種快速便宜的測序技術(shù)。




2005 年,Rothberg 的夢想終于實現(xiàn)了。454 生命科學等研究人員于 7 月在《 Nature 》雜志上發(fā)表了一篇題為“Genome sequencing in microfabricated high-density picoliter reactors ”的文章,介紹了一種邊合成邊測序(sequencingby synthesis)的技術(shù),比傳統(tǒng)的 Sanger 測序快 100 倍。


這種技術(shù)合成 DNA 片段,并將它們分開平行測序,再重新組合成基因組。它的效果也通過生殖支原體(Mycoplasma genitalium)這種細菌的測序而得到了證明。在 4 小時內(nèi),研究人員就完成了測序,且準確性超過 99.99% 。454 的方法之所以引起轟動,不僅是因為這個成果,而是因為它繞過了 Sanger 測序的限制,未來有望使測序時間和成本進一步下降。


人類基因組計劃的首席科學家 Francis S. Collins 博士對此評價道:“測序技術(shù)需要變得更小、更快速、更便宜,才能滿足個性化醫(yī)療的承諾。我們期待這種創(chuàng)新技術(shù)能夠應用在生物醫(yī)學研究,并最終應用于臨床?!钡拇_,隨著通量提高 100 倍,這種技術(shù)開辟了測序的新用途,包括個性化醫(yī)療、傳染病防治等。


不久之后,454 生命科學與羅氏合作,正式推出了 Genome Sequencer 20(GS20)系統(tǒng)。這是第一臺商業(yè)化的新一代測序儀,為高通量的 DNA 測序提供了一個方便的方案。它在 PicoTiterPlate 上開展大規(guī)模并行測序,采用先進的圖像處理,并利用獨特的數(shù)據(jù)分析,以獲得高質(zhì)量的結(jié)果。樣品制備之后,GS20 能夠在 5 小時的運行內(nèi)至少測序 2000 萬個堿基(20 Mb)。


這臺儀器甫一上市,就引起了科學界的關(guān)注。盡管價格不菲(50 萬美元),但 2005 年總共在全球安裝了 20 臺,包括 Broad 研究院、Sanger 研究院和 JGI,研究成果也陸續(xù)發(fā)表。此外,GS20 也榮獲了多個獎項,包括 R&D 100 大獎和華爾街日報的 2005 技術(shù)創(chuàng)新獎。


在收獲掌聲的同時,454 生命科學也在對 GS20 系統(tǒng)進行硬件和軟件的升級,希望將讀長從 100 bp 提高到 200 bp,甚至 400 bp,也力爭大幅提高通量。這些后來都實現(xiàn)了。最初的一年,454 并沒有碰到強勁的對手,但隨著 Solexa 儀器的問世,這一局面很快被打破。


Solexa 閃亮登場




早些年,人們在談到新一代測序儀時,經(jīng)常會提起 Solexa,而不是 Illumina。這是一家低調(diào)的公司,規(guī)模也不大,但是測序技術(shù)卻非常新穎。它開發(fā)出的測序儀,在通量上領(lǐng)先于其他競爭產(chǎn)品。收購 Solexa,也成為 Illumina 的轉(zhuǎn)折點,從此踏上高速發(fā)展的道路。


Solexa 成立于 1998 年的夏天,創(chuàng)始人是劍橋大學的化學家。它的核心是可逆測序技術(shù),也就是在大規(guī)模并行的芯片上,通過直徑為 1 微米的孔,每次測序一個堿基并成像。他們的目標是每次運行能獲得 10 億個堿基(1Gb)。這在當時簡直就像天方夜譚。風投告訴他們,如果能實現(xiàn) 1 Gb 的十分之一,就已經(jīng)很不錯了。


之后經(jīng)過一系列改進,并從瑞士測序公司 Manteia 處收購了簇生成技術(shù),也就是將 DNA 鏈擴增成含有 1000 個相同分子的簇,Solexa 的測序儀漸入佳境,讀長也從最初的 12bp 穩(wěn)步提高到 25bp。最后,研發(fā)人員開始建立 IT 系統(tǒng),來管理和評估數(shù)據(jù)的質(zhì)量。至此,Solexa 的測序儀已初具雛形。


2005 年初,Solexa 決定測序第一個真正的基因組,著名的 ΦX174 噬菌體基因組。2 月的一個周末,生物信息學家 Clive Brown 發(fā)郵件給同事,標題上寫著:“我們做到了!”噬菌體基因組被重新測序,且準確性超過 99.9%。有趣的是,他們并沒有發(fā)表文章。他們感興趣的是專利。


過了一年,Solexa 正式推出 1G Genetic Analyzer,宣稱能夠在 3 個月內(nèi)以 10 萬美元完成人類基因組測序。對于 10 萬美元的數(shù)字,CEO John West是這樣解釋的:“人類基因組有 30 億個堿基,重測序的覆蓋度大約是 15 倍。因此需要 45 億個堿基。如果每個運行要兩天,那就是 90 天。流動槽的定價將從 3000 美元降至 1000 美元,因此 45 個流動槽是 45000 元。如果考慮到儀器價格(40 萬美元)和五年折舊,那么三個月就是 20000 元?!?/span>


不過,West 的承諾在 2006 年并沒有實現(xiàn)。對于 30bp 的讀長而言,人類基因組的組裝是一項巨大的信息學挑戰(zhàn)。當時,Sanger 研究院每周已經(jīng)產(chǎn)生了 10-15 Gb 的數(shù)據(jù)。Clive Brown 開發(fā)出一款名為 the pipeline 的軟件給客戶使用,之后,它演化成為大家熟悉的 CASAVA。


2006 年 11 月,Illumina CEO Jay Flatley 向 Solexa 發(fā)出了 6.5 億美元的收購要約,以補充 Illumina 當時的基因分型和基因表達平臺。此次收購被劍橋大學新聞辦公室認為是“劍橋大學最成功的商業(yè)化故事之一”。Flatley 表示:“這次收購可能會被證明是最成功的收購之一,以及生命科學史上的新技術(shù)引進?!?/span>


Flatley 的預言并沒有錯。到 2007 年 2 月,Illumina 已經(jīng)售出了 12 臺儀器,之后又接到了幾十個新訂單。盡管它的讀長遠不及 454,但通量和每 Gb 的成本相當有利。到年底,GA 儀器的安裝數(shù)量已超過 200 臺,并在 2008 年再次翻番。2008 年春天,Illumina 推出了 GAII,硬件和軟件都經(jīng)過升級,讀長提高到 50bp,通量達到每次運行 3 Gb。彼時,他們終于達到了 10 萬美元人類基因組測序的里程碑。


之后的故事大家也許都聽過了。2008 年 5 月,荷蘭科學家利用 GA 首次繪制出女性的個人基因組圖譜。11 月,《 Nature 》雜志發(fā)表了三個人類基因組圖譜:炎黃一號–第一個亞洲人圖譜;第一個癌癥病人圖譜;第一個非洲人圖譜。這都有 GA 的功勞。


當時,Illumina 并非沒有競爭對手。除了 454,Sanger 測序的領(lǐng)導者 ABI 也在開發(fā)新一代測序平臺。Illumina 搶先進入市場,拔得頭籌。正如 Illumina 科學家 John Milton 所言,這是 GA 領(lǐng)先 SOLiD 系統(tǒng)的主要原因?!耙坏┻M入基因組中心,每個人都經(jīng)過培訓,那么他們就會堅持使用[這種技術(shù)]?!边@也是 Sanger 研究院堅持使用 Illumina 平臺的主要原因。


當然,ABI 并非等閑之輩,他們也在奮力追趕。


ABI 奮起直追




說起全自動測序儀,Applied Biosystems (ABI) 那是絕對的領(lǐng)頭羊,其 3730 旗艦測序儀在人類基因組計劃中立下赫赫戰(zhàn)功。然而,在新一代測序方面,454 和 Solexa 搶了先機,率先推出了 NGS 儀器。ABI 當然不會作壁上觀,讓客戶的實驗室里擺滿對手的儀器。


于是,它在 2006 年斥資 1.2 億美元收購了遺傳分析公司 Agencourt Personal Genomics (APG),為的是第二年將新一代測序系統(tǒng)推向市場。APG 的核心技術(shù)是 SOLiD (supported oligoligation detetion),其獨特之處在于以四色熒光標記寡核苷酸的連續(xù)連接合成為基礎(chǔ),取代了傳統(tǒng)的聚合酶連接反應,可對單拷貝 DNA 片段進行大規(guī)模擴增和高通量并行測序。


SOLiD 系統(tǒng)原本計劃在 2008 年推出,但 ABI 擴大了研發(fā)團隊,努力提高通量和讀長。同時,早期試用客戶也對這個系統(tǒng)給出了積極的反饋。因此,ABI 在 2007 年美國人類遺傳學協(xié)會的年會上正式推出了 SOLiD 系統(tǒng)。儀器標價為 60 萬美元,包括輔助設(shè)備和計算機,高于 454 和 Solexa 的儀器。


就當時而言,SOLiD 系統(tǒng)是通量最高的新一代測序平臺,每次運行可以產(chǎn)生 4Gb 的數(shù)據(jù)。此外,由于它采用雙堿基編碼技術(shù),在測序過程中對每個堿基判讀兩遍,能夠區(qū)分測序錯誤和多態(tài)性,故原始數(shù)據(jù)的準確性接近 99.95%,高于其他的新一代測序平臺。這也成為它的主要賣點之一。


2008 年,在 Illumina 宣布將人類基因組測序費用降至 10 萬美元后不久,ABI 就宣布,利用 SOLiD 測序平臺,人類基因組的測序成本低于 6 萬美元。這個價格包括樣品制備以及測序試劑的費用,但不包括人工和儀器折舊成本。而在一年前,454 生命科學對諾貝爾獎得主 James Watson 的基因組進行測序,費用接近 100 萬美元。


在 ABI 科學運營高級主管 Kenvin McKeman 的指導下,科學家們采用 ABI 的 SOLiD 系統(tǒng)對國際 HapMap 計劃中包含的一個人類 DNA 樣本進行重新測序。SOLiD 系統(tǒng)總共運行 7 次,產(chǎn)生 36Gb 的序列數(shù)據(jù),相當于 12 倍的覆蓋度。單次運行最高可產(chǎn)生高達 9Gb 的數(shù)據(jù),領(lǐng)先于其他測序平臺。


McKernan 表示:“我們相信這項研究驗證了新一代測序技術(shù)的前景,這些技術(shù)降低了分析人類基因組信息的成本,提高了精確度和速度。每個技術(shù)里程碑都使我們向著個性化醫(yī)療的方向邁進?!?/span>


至此,454、Illumina 和 ABI 在新一代測序領(lǐng)域形成了三足鼎立的局面。正是這種你追我趕,讓人類基因組圖譜的繪制成本大大降低,時間也大大縮短。不過,Illumina 率先進入大型的基因組中心,搶占了先機。此后它又推出了高通量的 HiSeq 系列,在通量上領(lǐng)先于 SOLiD。因此,ABI (及后來的 Life Technologies) 始終無力追趕。根據(jù) Frost & Sullivan 對 2010 年 NGS 市場份額的統(tǒng)計,Illumina 占 69%,Life Tech 占 16%,Roche 占 15%。


好在,Life Tech 高瞻遠矚,放眼快速經(jīng)濟的測序市場,在 2010 年收購了 Ion Torrent 公司。盡管這種半導體測序儀未必適合 30 億個堿基的人類基因組測序,但卻是更多小型實驗室的理想選擇。


后起之秀 PacBio




在新一代測序技術(shù)崛起的早期,市場主要被 Illumina、Life Tech 和 Roche 這三家公司占領(lǐng)。偶爾也有一些新的測序平臺出現(xiàn),但大多是雷聲大雨點小,不久便沒了下文。面對這些強大、成熟的系統(tǒng),新平臺要想站穩(wěn)腳跟,的確不是件容易的事。


在 2010 年的 AGBT 年會上,Pacific Biosciences 的測序儀吸引了眾人的注意。這臺名為 PacBio RS的測序儀被稱為第三代測序平臺,而有別于之前推出的二代測序平臺。至于什么是第三代測序,PacBio 當時的 CEO Hugh Martin 是這樣解釋的,“它就是在第二代測序(通量、成本)的基礎(chǔ)上添加非常長的讀長、極低的試劑成本,以及快速的運行時間”。


的確,PacBio RS 系統(tǒng)有著其他系統(tǒng)無可比擬的讀長,超過 1000 個堿基。這是因為 PacBio 的單分子實時 (SMRT) 測序反應是最接近天然狀態(tài)的聚合酶反應體系,最大限度地保持了聚合酶的活性。此外,樣品制備非??焖?,只需要 4-6 小時,而不是幾天。制備過程不需要 PCR,從而減少了錯誤和偏向。從樣本制備到測序,所需的時間還不到一天。


對于重測序而言,短讀長也許不是大問題,但是對于 denovo 測序,這可讓人們吃盡苦頭。例如,韓國極地研究所的 Hyun Park 在測序一種 GC 含量高達 71% 的極地微生物時發(fā)現(xiàn),即使利用 Illumina 平臺進行 200X 深度測序,仍無法獲得完整的基因組圖。組裝時產(chǎn)生了 185 個 Contig,而且缺口數(shù)量太多,根本無法通過 Sanger 法有效補齊。他們只好求助于 PacBio,而后僅用 15X 覆蓋度就能組裝得到 26 個 Contig,最終獲得了完整的基因組信息。


隨后,《 Nature Methods 》上發(fā)表的一篇文章又再次讓 PacBio 成為關(guān)注的焦點。研究人員利用 SMRT 技術(shù),直接測定了 DNA 的甲基化,這是二代測序技術(shù)無法實現(xiàn)的,因為它們在測序前需要 PCR 擴增,一擴增這些修飾標記就被置換而消失殆盡了。SMRT 技術(shù)利用 DNA 聚合酶的動力學特征,對堿基摻入時產(chǎn)生的停頓間隔脈沖信號足夠敏感,可區(qū)分 12 種以上不同類型的堿基修飾。這些信息也幫助解析了歐洲大腸桿菌疫情的元兇 E.coli O104:H4。


然而,PacBio 也受到高錯誤率的困擾。人們一聽到 85-87% 的原始準確性就嚇壞了。雖然 PacBio 也澄清,這是由于在測序過程中單個分子信號弱,偶爾會出現(xiàn)信號難于分辨的情況。出錯幾率是隨機的,與序列長度、序列組成無關(guān)。只要提高循環(huán)次數(shù),就能夠提高準確率。不過,PacBio 的業(yè)務(wù)還是一度陷入低迷,股價在 1 塊多徘徊。


2012 年,事情開始出現(xiàn)轉(zhuǎn)機。冷泉港實驗室的 Michael Schatz 開發(fā)了一種糾錯算法,用二代測序的短讀長高精確數(shù)據(jù)對三代長讀長數(shù)據(jù)進行糾錯,這種稱為“混合糾錯拼接”的算法發(fā)表在 7 月的《 Nature Biotechnology 》上。通過混合糾錯法,他們發(fā)現(xiàn)“數(shù)據(jù)幾近完美”。


這種方法融合了二代測序和三代測序的優(yōu)勢。“對于短讀長,哪怕無限制地提高覆蓋度,也不能解決復雜區(qū)域的測序問題。但長讀長可以跨越這次復雜區(qū)域,因此不需要太高的覆蓋度就可以對付。同理,長讀長也可以用于檢測并鑒定單倍體型和轉(zhuǎn)錄本的可變剪切,”Schatz 談道。


第二年,PacBio 發(fā)布了新版本的測序儀 – PacBio RS II,平均讀長達 5,000 bp,最長讀長超過 20,000bp,且通量較之前的版本增加一倍。隨著硬件和軟件的不斷升級,訂單數(shù)量也開始增加。到 2013 年底,PacBio 更與 Roche 合作,聯(lián)手打造一款臨床測序產(chǎn)品。此后,引用 PacBio 系統(tǒng)的研究成果不斷在各種刊物上發(fā)表。


Illumina 超高通量測序平臺 HiSeq X Ten 的上市也為 PacBio 帶來了新訂單。韓國公司 Macrogen 和 J. Craig Venter 的 Human Longevity 在安裝了 HiSeq X Ten 系統(tǒng)之后都購買了兩臺 PacBio RS II 系統(tǒng)。他們在開展大規(guī)模人類基因組測序研究時,希望利用 PacBio 的長讀長來弄清結(jié)構(gòu)變異及其他復雜區(qū)域。


至此,PacBio 完成了一次漂亮的逆襲。它憑借自身的獨特優(yōu)勢,在競爭激烈的新一代測序市場上站穩(wěn)腳跟,并帶來豐碩的研究成果。當然,儀器仍在不斷升級。最新型號的 Sequel 測序儀將在明年上市。

轉(zhuǎn)自《生物探索》


    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多