解讀文獻題目:
TCGA based integrated genomic analyses of ceRNA network and novel subtypes revealing potential biomarkers for the prognosis and target therapy of tongue squamous cell carcinoma
這是一篇2019年發(fā)表在plos one 的純生信文章。
摘要 目的
該研究旨在研究舌鱗狀細胞癌(TSCC)生物學發(fā)展中的ceRNA網(wǎng)絡,通過使用基于癌癥基因組圖譜(TCGA)的整合基因組分析來鑒定TSCC的新分子亞型,以篩選靶向治療和預后的潛在生物標志物。數(shù)據(jù)庫。 材料與方法
從TCGA和GEO數(shù)據(jù)庫下載基因表達數(shù)據(jù)。差異表達的RNA(DERNAs)由R中的DESeq2來定義。功能富集分析使用R中的聚集體進行.PPI網(wǎng)絡通過參考String網(wǎng)站建立。通過R中的survival包進行DERNA的生存相關分析。從Starbase v3.0數(shù)據(jù)框獲得mRNA,miRNA和lncRNA之間的相互作用并構建ceRNA網(wǎng)絡。 Consensus Cluster Plus軟件包用于識別分子亞型。通過將它們與GEO微陣列數(shù)據(jù)進行比較來驗證所有關鍵基因。使用SPSS 22.0對不同亞型的臨床特征進行統(tǒng)計分析。 結果
從腫瘤和正常組織中鑒定出總共2907個mRNA(1366個上調和1541個下調),191個miRNA(98個上調和93個下調)和1831個lncRNA(1151個上調和680個下調) ?;谏鲜龅牟町怰NA成功構建了ceRNA網(wǎng)絡,并使用了15個DEmRNA,1個DEmiRNA,2個與預后相關的DElncRNA。 結論
該研究構建了一個ceRNA網(wǎng)絡并鑒定了TSCC的分子亞型,我們的研究結果為這種難治性癌癥潛在的治療靶點和預后指標提供了新的標志物。 方法和材料 1.數(shù)據(jù)收集和預處理
從TCGA數(shù)據(jù)庫(https://portal.gdc./ )獲得TSCC的基因表達數(shù)據(jù)(lncRNA、mRNA和miRNA表達譜數(shù)據(jù))和相應的TSCC臨床數(shù)據(jù),收集126個TSCC樣品和13個正常對照樣品。在這些數(shù)據(jù)中,mRNA和lncRNA表達數(shù)據(jù)是基于Illumina HiSeqRNASeq平臺獲得的,而miRNA數(shù)據(jù)是從Illumina HiSeqmiRNASeq平臺收集的。 首先對TCGA的RNA表達預處理,篩選掉其中的低表達基因(count<10)進行預處理。根據(jù)GENCODE Release 29(GRCh38.p12)(https://www./human/ )注釋mRNA和lncRNA。 而miRNA是基于miRbase v22數(shù)據(jù)庫(http://www./index.shtml#opennewwindow )進行注釋。
通過搜索“舌鱗狀細胞癌”,從Gene Omnibus(GEO)數(shù)據(jù)庫(http://www.ncbi.nlm./geo/ )下載TSCC(GSE30784,GSE13601和GSE28100)的3個基因表達譜。 “(2019年1月)。基于Affymetrix Human Genome U133 Plus 2.0 Array和U95 Version 2 Array確定GSE30784和GSE13601。 GSE28100的平臺是Agilent-021827人miRNA微陣列(V3)(miRBase釋放12.0 miRNA ID版本)。
2.鑒定TSCC中差異表達的mRNA,miRNA和lncRNA
使用R軟件的DESeq2包鑒定TSCC樣品和正常對照樣品中差異表達的lncRNA(DElncRNA),mRNA(DEmRNA),miRNA(DEmiRNA)。將P值設置為FDR, | log2(FC)| > 1.5且P值<0.05被設定為差異基因的閾值。隨后根據(jù)R的pheatmap包繪制熱圖。 GO注釋和KEGG途徑的功能富集分析
R的ClusterProfiler v3.8包用于分析和可視化基因的功能譜(基因本體論(GO)注釋和京都基因和基因組百科全書(KEGG)途徑)以確定DEmRNA之間的共享功能。 P <0.05被認為是GO和KEGG富集分析的閾值。 4.建立蛋白質 - 蛋白質相互作用(PPI)網(wǎng)絡
為了理解DEmRNA的潛在相互作用,STRING網(wǎng)站被用于構建PPI網(wǎng)絡,該網(wǎng)絡由Cytoscape軟件可視化。 5.與預后相關的DEmRNA,DElncRNA和DEmiRNA
通過使用R的survival包進行生存分析以評估差異表達的RNA在TSCC患者中的預后價值。根據(jù)每一個DEmRNA,DElncRNA和DEmiRNA的各自表達量數(shù)據(jù),將所有樣品分成高表達組(大于中位數(shù))或低表達組(小于中位數(shù))。使用Kaplan-Meier方法繪制生存曲線。采用對數(shù)秩檢驗來評估統(tǒng)計學顯著性。 P <0.05被認為具有統(tǒng)計學意義。 6.預測lncRNA-miRNA和miRNA-mRNA相互作用
我們通過使用starBase數(shù)據(jù)庫預測DElncRNA和DEmiRNA或DEmRNA和DEmiRNA之間的相互作用,starBase記錄了來自許多個測序數(shù)據(jù)的超過110萬個miRNA-ncRNA,250萬個miRNA-mRNA和150萬個RNA-RNA相互作用。此外,starBase整合了來自miRanda,Targerscan和miRmap數(shù)據(jù)庫的預測結果。只有被記錄為負向相關關系的DEmiRNA和DEGs,DElncRNAs和DEmiRNAs被包括在ceRNA網(wǎng)絡中。 7.構建ceRNAs網(wǎng)絡
根據(jù)ceRNA理論,使用Cytoscape軟件v3.6.1整合DEmiRNA和DEmRNA以及DE1ncRNA和DEmiRNA的選擇的相互作用以構建DElncRNAs-DEmiRNAs-DEmRNAs ceRNA網(wǎng)絡。 結果 TSCC中的DElncRNA,DEmiRNA和DEmRNA 總共鑒定出總共2907個差異表達的mRNA(1366個上調和1541個下調),191個miRNA(98個上調和93個下調)和1831個差異表達的lncRNA(1151個上調和680個下調)。 miRNAseq數(shù)據(jù)| log2(FC)|> 1.5和P值<0.05。 具有差異表達的RNA在熱圖中可視化(圖1)。 表1中列出了前10個DElncRNA,DEmiRNA和DEmRNA。