這里我們一起讀文獻:Circular RNAs expression profiles in plasma exosomes from early‐stage lung adenocarcinoma and the potential biomarkers 來看看cirRNA-seq分析的一般流程。 circRNA數(shù)據(jù)分析流程重中之重其實就是circRNA的定量,在普通的mRNA-seq或者大家熟知的lncRNA-seq里面,我們都是正常的比對,每個reads都會有基因組坐標,然后跟我們的參考gtf文件進行坐標映射后計數(shù)即可。 但是cirRNA不太一樣,需要先鑒定出來,然后才能定量,比如本研究采用的是就DCC軟件流程,其實2015年12月10日發(fā)表在《Nucleic Acid Research》 的 https://www.ncbi.nlm./pubmed/26657634 ,文獻提到的5種算法預測得到的結(jié)果差別較大,而且有很高的假陽性,所以作者建議可以使用多種方法聯(lián)合預測或者采用去線性RNA建庫的方法進行circRNA研究。 首先看circRNA的注釋分類前面我們提到過,circRNA的注釋很豐富了,CircRNA檢測的基本原理是去識別反向剪切的位點(backsplice),最主要的circRNA類型是外顯子來源的,當然,在內(nèi)含子、間區(qū)、UTR區(qū)域、lncRNA區(qū)域以及已知轉(zhuǎn)錄本的反義鏈區(qū)域也都鑒定到circRNA,同一個位點可能形成多個circRNA,每個circRNA可能包含一個或多個外顯子。 比如本研究鑒定到的兩萬多個circRNA注釋后分類如下; 其實本研究還統(tǒng)計了circRNA在不同染色體的數(shù)量,還有其它數(shù)據(jù)庫收錄與否等等 表達矩陣的標準的差異分析其實circRNA-seq和circRNA-array最后都是得到表達矩陣,然后就是走標準分析流程,火山圖,熱圖,GO/KEGG數(shù)據(jù)庫注釋等等。這些流程的視頻教程都在B站和GitHub了,目錄如下:
僅僅是最后得到的差異分子,并不是以前的mRNA后面的基因名,而是miRNA,lncRNA,甚至circRNA的ID,看起來很陌生罷了。感興趣可以細讀表達芯片的公共數(shù)據(jù)庫挖掘系列推文 ; 本文得到的熱圖如下: 也可以列出最顯著的那些circRNA的詳細信息,如下: 其實這里有一點點問題,看起來線粒體上面的cirRNA有些多了! 核心仍然是對circRNA定量和找差異比如文章:RNA-Seq profiling of circular RNAs in human laryngeal squamous cell carcinomas |
|