2023年42篇(共392篇)原創(chuàng)文章 4月末,有幸收到元英進(jìn)院士邀請(qǐng),到天津參加京津冀DNA存儲(chǔ)前沿研討會(huì)。因上個(gè)月二陽(yáng)后身體不適,公眾號(hào)緩慢更新,很是抱歉。元老師的報(bào)告內(nèi)容豐富,我分成上、中、下三篇撰寫(xiě)“聽(tīng)講筆記”。行文過(guò)程中得到元老師親自指導(dǎo),他非常認(rèn)真,我受益匪淺,萬(wàn)分感激。如有錯(cuò)漏之處,還是我個(gè)人的學(xué)識(shí)淺薄所致,文責(zé)自負(fù),敬請(qǐng)指正。本文主要介紹DNA存儲(chǔ)研究實(shí)例和面臨挑戰(zhàn)。實(shí)例:高可靠硬盤(pán)模式——1c㎡存儲(chǔ)2億部電影 元老師主持的項(xiàng)目,將開(kāi)國(guó)大典視頻、十九大報(bào)告的視頻和文字(>3MB),存儲(chǔ)進(jìn)3微克的凍干粉內(nèi)。 先把0-1數(shù)據(jù)塊進(jìn)行編碼,然后分割為子塊。每個(gè)子塊用一條長(zhǎng)為96個(gè)堿基的鏈,把數(shù)據(jù)存儲(chǔ)起來(lái)。但鏈的數(shù)量太多了,彼此怎么“區(qū)分”?我們就像看書(shū)加索引一樣,索引也是ATCG的序列。兩邊再加引物,便擴(kuò)增出來(lái)。由此合成了4600w個(gè)堿基,形成寡核苷酸的合成池,存儲(chǔ)進(jìn)3微克的凍干粉。讀取時(shí),選擇pg級(jí)樣品進(jìn)行聚合酶鏈?zhǔn)椒磻?yīng)(PCR),最終通過(guò)高通量測(cè)序,獲取大量讀段,實(shí)現(xiàn)數(shù)據(jù)修復(fù)。按照這樣的技術(shù),存儲(chǔ)密度為125PB/g=212.5PB/cm3,高于目前存儲(chǔ)介質(zhì)5-7個(gè)數(shù)量級(jí)。大家可以想象一下,一個(gè)方糖大小的存儲(chǔ)介質(zhì)(1cm3),可以存放212.5*1024個(gè)TB,即217600TB的信息。假設(shè)一部高清電影需要1GB的存儲(chǔ)空間,存儲(chǔ)2億多部電影,只需要1塊“方糖”。更多的內(nèi)容,可以參考元老師團(tuán)隊(duì)的論文:元英進(jìn)*. 音視頻文件的DNA信息存儲(chǔ). 中國(guó)科學(xué)· 生命科學(xué), 2019, 49: 1–5.
實(shí)例:光盤(pán)模式——酵母也可當(dāng)CD 大家都知道酵母有16條染色體,元老師課題組加了一條人工染色體,用于存儲(chǔ)數(shù)字信息。編碼設(shè)計(jì)→合成組裝→支持穩(wěn)定復(fù)制→基于蛋白納米測(cè)序讀取。酵母CD,采用具有糾錯(cuò)能力的編碼方法,將圖片及視頻等數(shù)字化信息,轉(zhuǎn)化成DNA序列,通過(guò)酵母體內(nèi)一次組裝,將序列和載體共同構(gòu)建穩(wěn)定的環(huán)狀DNA,作為新型存儲(chǔ)介質(zhì)。讀取時(shí),數(shù)據(jù)隨酵母指數(shù)型快速擴(kuò)增,只需要89個(gè)小時(shí),全球每一個(gè)人都可以擁有一份存儲(chǔ)在酵母CD中的數(shù)據(jù)副本。美國(guó)紐約大學(xué)Jef Boeke院士在2015年酵母基因組合成國(guó)際聯(lián)盟會(huì)議上明確指出: 天津大學(xué)開(kāi)發(fā)的缺陷快速定位(PoPM)和精確修復(fù)方法,大大加速了整個(gè)酵母基因組合成國(guó)際計(jì)劃的進(jìn)展。 元老師團(tuán)隊(duì)的合成酵母染色體工作,“突破了目前在單個(gè)細(xì)胞內(nèi)僅有幾千個(gè)堿基的數(shù)據(jù)存儲(chǔ)量——帝國(guó)理工Tom Ellis”。 因此,該工作榮獲2017年中國(guó)科學(xué)十大進(jìn)展的殊榮,并編入美國(guó)約翰·霍普金斯大學(xué)的BAG本科課程。 更多內(nèi)容可閱讀元老師的論文: Yuan YJ* et al., (2021). An artificial chromosome for data
storage. National Science Review, 8(5):nwab028.
Yuan YJ* et al. Science, 2017, 355:
eaaf4706. Yuan YJ* et al. Science,
2017, 355: eaaf4704.
實(shí)例:將10幅敦煌壁畫(huà)存入DNA 敦煌壁畫(huà)是我國(guó)的文化瑰寶,但隨著時(shí)間的流逝,因風(fēng)化等問(wèn)題造成的損毀嚴(yán)重。只有運(yùn)用先進(jìn)科學(xué)技術(shù)提高保護(hù)水平,才能讓這一世界文化遺產(chǎn)代代相傳。元老師團(tuán)隊(duì)將10幅敦煌壁畫(huà),編碼成為21萬(wàn)條DNA寡核苷酸鏈,合成寡核苷酸池。通過(guò)加速老化實(shí)驗(yàn)驗(yàn)證,壁畫(huà)的數(shù)據(jù)在實(shí)驗(yàn)室常溫下可保存超過(guò)1千年,在9.4℃條件下,可保存2萬(wàn)年。DNA分子成為世界上最可靠的數(shù)據(jù)存儲(chǔ)介質(zhì)之一,可以讓面臨老化破損危機(jī)的人類(lèi)文化遺產(chǎn)信息保存千萬(wàn)年甚至更久。詳情可見(jiàn)元老師論文:Yuan YJ* et al. Nature Communications. 2022DNA合成突破的關(guān)鍵環(huán)節(jié) 序列合成,關(guān)鍵是成本、通量、合成速度。目前,合成存儲(chǔ)1MB數(shù)據(jù),需要5萬(wàn)人民幣。也就是說(shuō),通過(guò)DNA存儲(chǔ)一張照片都要好幾萬(wàn)(手機(jī)里隨手拍的照片精貴了吧)。成本有希望降低么?有,但需要借助大規(guī)模生產(chǎn)技術(shù)的提升。做個(gè)類(lèi)比,原油大約3300元/噸,生產(chǎn)出聚乙烯7330元/噸。差價(jià)只有2倍多。但為何生產(chǎn)聚乙烯還賺錢(qián)呢?因?yàn)橛昧看?,催生大?guī)模生產(chǎn),就把成本降下來(lái)了。我們?cè)倏磫蝹€(gè)堿基的成本,非常低。從單體到產(chǎn)品,有50-100倍的差距。 因此,需要科技工作者眾志成城,把DNA存儲(chǔ)成本降下來(lái),用量提上去,進(jìn)入可商業(yè)化的良性循環(huán)。1. DNA存儲(chǔ)是合成生物學(xué)與信息技術(shù)融合的典范。借助高通量DNA合成與測(cè)序,有望滿(mǎn)足不斷增長(zhǎng)的海量數(shù)據(jù)存儲(chǔ)需求。可以利用生物技術(shù),應(yīng)對(duì)半導(dǎo)體與信息技術(shù)面臨的趨向極限的挑戰(zhàn)。
2. 基于人工染色體的數(shù)據(jù)存儲(chǔ)模式,完成了一種全新的DNA存儲(chǔ)方式的概念驗(yàn)證,豐富了DNA功能研究的案例。 3. DNA存儲(chǔ)存在合成成本高、讀寫(xiě)速度慢、與現(xiàn)代存儲(chǔ)系統(tǒng)融合等挑戰(zhàn)。
|