用DNA取代硬盤計(jì)算 新材料 凱瑟琳·波爾扎克(Katherine Bourzac) 2013-01-24 19:45:33利用生物分子對(duì)MP3、文本文件和圖片進(jìn)行編碼的研究人員表示,DNA將在幾十年之后成為有競爭力的存儲(chǔ)介質(zhì)。
為什么重要: 隨著數(shù)字化信息量的增長,如何找到可靠的長期存儲(chǔ)介質(zhì)逐漸成為一大問題。
有朝一日,DNA的作用可能不只是生命的藍(lán)圖,還可能以不可想象的壓縮形式將大量的文檔、音樂或圖片儲(chǔ)存幾千年之久。
位于英國辛克斯頓的歐洲生物信息學(xué)研究所的研究人員展示了一種新方法,能夠用這種方式對(duì)幾種常見的計(jì)算機(jī)文件格式進(jìn)行可靠編碼。隨著DNA測序和合成的價(jià)格持續(xù)下降,研究人員估計(jì),DNA這種生物存儲(chǔ)介質(zhì)將在未來幾十年內(nèi)變得有競爭力。
DNA的信息存儲(chǔ)密度至少相當(dāng)于現(xiàn)有介質(zhì)的1000倍,但是直到最近,DNA合成的成本才降下來,而之前這一技術(shù)一直極為罕見。不過,傳統(tǒng)上的數(shù)字信息的長期存儲(chǔ)方式繼續(xù)暴露出很多問題。一般用來存儲(chǔ)檔案的磁帶在幾十年之后會(huì)變得脆弱,磁粉涂層會(huì)脫落。即便用來存儲(chǔ)信息的物理介質(zhì)保持不變,存儲(chǔ)格式也總在變化。這意味著數(shù)據(jù)必須轉(zhuǎn)換成新格式,否則就將無法讀取。
相比之下,DNA可以長時(shí)間保持穩(wěn)定,而且只使用一種可能一直有用的格式。該項(xiàng)目的負(fù)責(zé)人尼克·高德曼(Nick Goldman)說:“我們想把存儲(chǔ)介質(zhì)和能夠讀取介質(zhì)的機(jī)器分離開來,我們總有讀取DNA的技術(shù)?!备叩侣岬?,目前已經(jīng)找到幾萬年前的DNA碎片,一直穩(wěn)定不變。而且DNA如果被冷藏或冷凍起來,可以保持更長時(shí)間的穩(wěn)定。
英國的研究人員將存有馬丁·路德·金的《我有一個(gè)夢想》演講的MP3文件、一篇科學(xué)論文的PDF文檔、一張JPEG彩色圖片以及一首莎士比亞的十四行詩的ASCII文本文檔用DNA進(jìn)行了編碼。DNA文件的存儲(chǔ)密度約為每克2.2PB。
以前也曾有人演示過DNA數(shù)據(jù)存儲(chǔ)。比如去年夏天,由哈佛大學(xué)遺傳學(xué)教授喬治·丘奇(George Church)領(lǐng)導(dǎo)的研究團(tuán)隊(duì)就使用DNA存儲(chǔ)技術(shù)對(duì)一本書進(jìn)行了編碼。
高德曼說,新研究的不同之處在于,研究人員將精力集中在實(shí)用的、可容錯(cuò)的設(shè)計(jì)上。為了創(chuàng)建DNA文件,研究人員編制了軟件,將數(shù)字高電平和低電平轉(zhuǎn)換為DNA堿基的字母表---A、T、C、G。這一方法確保不會(huì)出現(xiàn)重復(fù)的堿基,如AA或GG,重復(fù)的堿基會(huì)導(dǎo)致DNA合成和測序過程中更高的錯(cuò)誤率。
文件被分為多個(gè)部分,每個(gè)部分都用索引代碼的書擋分隔,索引中包括某堿基應(yīng)歸屬哪個(gè)文件以及某一文件的哪個(gè)部分---就像一本書上的頁碼和標(biāo)題相類似。
編碼軟件同樣保證了一定的余量。文件的每一部分都由四種不同的片段所代表,所以即便出現(xiàn)了幾處退化,也很容易修復(fù)數(shù)據(jù)。
研究人員正與加州大學(xué)圣克拉拉分校的 Agilent Technologies合作,對(duì)DNA片段進(jìn)行合成,然后展示出他們能夠?qū)ζ錅y序,并將文件精確地重建。這一成果發(fā)表在昨天的《自然》雜志上。
高德曼的團(tuán)隊(duì)估計(jì),目前用DNA進(jìn)行數(shù)據(jù)編碼的成本為12400美元/MB,讀回原數(shù)據(jù)還要再加220美元/MB。高德曼表示,如果DNA合成的費(fèi)用如預(yù)期般地在未來十年內(nèi)下降兩個(gè)數(shù)量級(jí),那么DNA數(shù)據(jù)存儲(chǔ)的成本不久就會(huì)低于磁帶存儲(chǔ)。
位于北卡羅萊納州達(dá)勒姆的半導(dǎo)體研究公司負(fù)責(zé)存儲(chǔ)技術(shù)的程序主管維克多·日爾諾夫(Victor Zhirnov)說,因?yàn)槟壳暗某杀咎撸訢NA數(shù)據(jù)存儲(chǔ)可能會(huì)最先用于存儲(chǔ)不頻繁訪問的數(shù)據(jù)檔案上。在前景的展望上,他表示,將出現(xiàn)一種“更富侵略性的技術(shù)”來取代閃存。閃存是一種用于便攜電子設(shè)備上的不易丟失數(shù)據(jù)的存儲(chǔ)技術(shù),產(chǎn)量已經(jīng)達(dá)到了極限。關(guān)鍵是要開發(fā)出與DNA存儲(chǔ)相配套的整個(gè)硬件系統(tǒng),而不僅僅是測序機(jī)與合成機(jī)。
哈佛大學(xué)的丘奇表示,他正在努力解決這個(gè)問題。他說:“我們能夠持續(xù)地逐步提高讀寫DNA的能力,但我想完全跳出這個(gè)框架。”目前,丘奇正在開發(fā)能夠直接將視頻和音頻這樣的模擬信號(hào)編碼成DNA的系統(tǒng),從而一次性地消滅傳統(tǒng)電子設(shè)備。 |
|