來源:生物探索 2023-06-20 13:55 自2012年CRISPR-Cas9技術(shù)問世以來,基因編輯便駛?cè)肓丝燔嚨溃〉昧艘幌盗行峦黄?。如果將CRISPR-Cas9比作能夠破壞目標(biāo)基因的分子剪刀,那么base editor(堿基編輯器)可以稱為 自2012年CRISPR-Cas9技術(shù)問世以來,基因編輯便駛?cè)肓丝燔嚨?,取得了一系列新突破。如果將CRISPR-Cas9比作能夠破壞目標(biāo)基因的分子剪刀,那么base editor(堿基編輯器)可以稱為分子鉛筆,因其能對單個核苷酸進行替換。2019年開發(fā)的prime editor則具有更強大的功能,能夠?qū)蚪M進行搜索和替換,堪稱分子世界的“文字處理器”。 開發(fā)這些技術(shù)的最終目標(biāo)是修復(fù)人類基因中的有害突變。16,000多個小的缺失變異與人類疾病存在因果關(guān)系,理論上可以通過插入缺失的序列來修復(fù)。囊性纖維化就是一個很好的例子,70%的病例由三核苷酸缺失而引起。 為了實現(xiàn)臨床應(yīng)用,人們需要一種技術(shù)來準(zhǔn)確、高效且安全地插入序列,避免出現(xiàn)意外的結(jié)果。prime editing系統(tǒng)雖然在治療囊性纖維化等遺傳病上表現(xiàn)出巨大潛力,但目前仍不清楚哪些因素決定了編輯效率。 英國Wellcome Sanger研究院和愛沙尼亞塔爾圖大學(xué)的研究人員近日在Nature Biotechnology雜志上發(fā)文稱,他們開發(fā)出一種新工具,可預(yù)測將基因編輯的DNA序列成功插入基因組的幾率。
在這項研究中,研究人員試圖系統(tǒng)評估插入序列的長度和組成、細胞系、目標(biāo)位點以及prime editor的不同版本如何影響插入效率。 為此,他們共設(shè)計了3,604條pegRNA,編碼切口位點上游的插入物,這些插入物的長度從1nt到69nt不等,且GC含量不同。他們將序列插入兩個細胞系(HEK293T和HAP1細胞)中,靶向四個目標(biāo)位點(HEK3、EMX1、FANCF和CLYBL)。一周后,他們對這些細胞進行基因組測序,觀察編輯是否成功。評估插入效率的整體策略詳見圖1。 圖1 prime插入效率的高通量測定
由于插入率的變化跨越了三個數(shù)量級,于是研究人員試圖了解相關(guān)的特征,首先是插入物的長度。他們在HEK293T細胞中發(fā)現(xiàn)了兩個特點:3和4nt序列的插入率高于其他序列;15-21nt序列的插入率高于周圍的序列。不過在HAP1細胞中,1-4 nt短序列的插入率并沒有高于較長序列。他們將其歸因于錯配修復(fù)(MMR)系統(tǒng),因為HEK293T細胞在MMR上存在部分缺陷。敲除錯配修復(fù)基因MLH1的HAP1細胞也證明了這一點,表明MMR系統(tǒng)阻礙了短序列的插入。 之后,他們分析了prime editing的不同步驟如何影響序列的插入率。他們發(fā)現(xiàn),若pegRNA中帶有四個或更多的連續(xù)腺嘌呤,則插入率會大大下降。此外,prime editing中的另一個重要步驟是帶有5’ flap(包含野生型序列)和3’ flap(包含插入物)的中間產(chǎn)物之間達到平衡,而5’ flap核酸酶FEN1及3’ flap核酸酶TREX1和TREX2介導(dǎo)了這種平衡。他們發(fā)現(xiàn),3’ flap核酸酶TREX1和TREX2抑制了較長序列的插入。 同時,插入序列的核苷酸組成和二級結(jié)構(gòu)也會影響插入率。研究人員發(fā)現(xiàn),prime editing系統(tǒng)對胞嘧啶有著明顯的偏好。插入序列中每增加1%的胞嘧啶,則插入率平均增加2.2%。相反,腺嘌呤和胸腺嘧啶的百分比則降低了各個位點的插入率。此外,他們還發(fā)現(xiàn),結(jié)構(gòu)強度更高的序列能夠被更有效地插入。 在此過程中,他們使用了Twist Bioscience提供的寡核苷酸池。據(jù)Twist介紹,他們獨特的硅基DNA合成平臺能夠在單次運行中生成超過一百萬條寡核苷酸,對數(shù)量幾乎沒有限制,而且寡核苷酸池精準(zhǔn)均一,讓人們對實驗結(jié)果充滿信心。此外,實驗中使用的多個載體和基因片段也是由Twist Bioscience提供的。
在了解影響插入率的多個因素后,研究人員接下來想預(yù)測不同序列在同一位點的插入效率。他們采用了機器學(xué)習(xí)的方法,挑選出10個特征來訓(xùn)練數(shù)據(jù),包括插入序列的長度、組成、pegRNA二級結(jié)構(gòu)和MMR等。這種稱為MinsePIE的方法能夠很好地預(yù)測測試數(shù)據(jù)的插入效率,相關(guān)性達到0.68(圖2)。 在現(xiàn)有數(shù)據(jù)上進行訓(xùn)練后,他們在新數(shù)據(jù)上測試MinsePIE模型,發(fā)現(xiàn)它能夠準(zhǔn)確預(yù)測多個插入序列的成功率。之后,他們還對預(yù)測的序列進行實驗測試。與預(yù)測插入率較低的變體相比,預(yù)測插入率較高的密碼子變體確實表現(xiàn)出較高的插入率,這凸顯了MinsePIE模型在密碼子優(yōu)化方面的優(yōu)勢。研究人員認(rèn)為,這種計算模型可以幫助人們選擇出最有效的序列寫入基因組中。 圖2 預(yù)測prime插入效率 最后,對于如何提高prime editing系統(tǒng)的插入效率,研究人員提出了幾點建議。他們建議選擇胞嘧啶含量高且容易形成二級結(jié)構(gòu)的序列。對于使用U6啟動子的pegRNA,盡量避免腺嘌呤的插入。對于小于14nt的序列,暫時抑制MMR或敲除MLH1將極大提高插入效率。總的來說,這項工作增加了人們對短序列插入效率的理解,有望實現(xiàn)復(fù)雜的基因組工程和糾正各種致病突變。 |
|