生信已經(jīng)成為科研圈發(fā)SCI的神器了,檢索PubMed上可見發(fā)表的文章不管高分低分都涉及生信,但是許多人聽見生信編程就望而卻步,產(chǎn)生恐懼心理,我們特邀請醫(yī)科堂生信挖掘一對一輔導(dǎo)訓(xùn)練營周老師開設(shè)專欄,通過文章實(shí)例復(fù)現(xiàn)的方式幫助大家學(xué)懂文章,看懂代碼,希望能夠給大家有所幫助。 大家好!今天分享一篇2021年4月發(fā)表在《Frontiers in Oncology》(IF=6.244,中科院二區(qū)期刊)上的一篇文章,題為"An Immune-Related lncRNA Expression Profile to Improve Prognosis Prediction for Lung Adenocarcinoma: From Bioinformatics to Clinical Word" 在這項(xiàng)研究中,系統(tǒng)的闡明了肺腺癌中的免疫相關(guān)lncRNA表達(dá)圖譜,并且通過單因素,多因素回歸分析構(gòu)建了包含4個(gè)免疫相關(guān)lncRNA的預(yù)后模型,從而形成高低風(fēng)險(xiǎn)組,發(fā)現(xiàn)具有不同的預(yù)后和免疫細(xì)胞浸潤。GO、KEGG分析顯示了高低風(fēng)險(xiǎn)組差異基因的富集通路,GEPIA數(shù)據(jù)庫展示了單個(gè)免疫相關(guān)lncRNA在腫瘤和癌旁的表達(dá)情況,以及和生存預(yù)后的關(guān)系。最后此研究中,收集了臨床78例肺腺癌的表達(dá)情況,于體外驗(yàn)證了四個(gè)免疫相關(guān)lncRNA的預(yù)后模型。1.免疫相關(guān)lncRNAs特征的構(gòu)建與評估從TCGA數(shù)據(jù)庫中下載497個(gè)LUAD樣本以及54個(gè)癌旁樣本的表達(dá)矩陣,使用perl腳本分離出lncRNA和mRNA,從中提取出331個(gè)免疫基因的表達(dá)矩陣,并通過person相關(guān)分析得到免疫相關(guān)lncRNA。緊接著,采用單因素、多因素分析構(gòu)建了4個(gè)免疫預(yù)后相關(guān)lncRNA模型。主要使用代碼:perl分離腳本,單因素R腳本,多因素R腳本 2.評估細(xì)胞和組織中免疫相關(guān) lncRNA 的表達(dá)進(jìn)一步探討了四個(gè)相關(guān)lncRNA在細(xì)胞和組織中的表達(dá),采用PCR檢測肺腺癌細(xì)胞和對照的表達(dá)量,組織及生存曲線采用數(shù)據(jù)庫Gepia里面的數(shù)據(jù)。主要使用代碼:Gepia數(shù)據(jù)庫http://gepia./。Gepia數(shù)據(jù)庫是北大開發(fā)的對TCGA數(shù)據(jù)可視化的一個(gè)在線網(wǎng)站,對于腫瘤分析是一個(gè)非常不錯(cuò)的工具。 3.四種免疫相關(guān) lncRNA 與其他臨床病理特征的關(guān)聯(lián)采用R語言對高低風(fēng)險(xiǎn)組的四個(gè)免疫相關(guān)lncRNA進(jìn)行熱圖可視化,并且分別展示了在stage, T分期,M分期和N分期中四種免疫相關(guān)lncRNA的表達(dá)情況。主要使用代碼:R語言臨床性狀相關(guān)性分析腳本 4.風(fēng)險(xiǎn)評分與年齡、性別、AJCC分期以及AJCC-TNM的關(guān)系采用柱狀圖,比較了不同臨床形狀中高低風(fēng)險(xiǎn)的表達(dá)水平,類似卡方檢驗(yàn),結(jié)果發(fā)現(xiàn)高低風(fēng)險(xiǎn)和性別,AJCC分期,M分期,N分期相關(guān)5.高低風(fēng)險(xiǎn)組差異基因的功能和通路富集分析采用limma包得出高低風(fēng)險(xiǎn)組的差異基因,對部分差異基因進(jìn)行熱圖展示,并且采用GO和KEGG進(jìn)行富集分析。主要使用代碼:R語言差異分析腳本,GO分析腳本和KEGG富集分析腳本。 6.比較高低風(fēng)險(xiǎn)組的免疫狀態(tài)基于PCA降維分析,比較了全基因組,所有免疫相關(guān)lncRNA,四種免疫相關(guān)lncRNA三種模型的區(qū)分度,可以發(fā)現(xiàn)四種免疫相關(guān)lncRNA的紅色綠色分開良好。進(jìn)一步,采用GSEA富集分析,查看Immune Response和Immune System Process的富集情況。最后采用CIBERSORT比較高低分析組的免疫細(xì)胞情況。主要使用代碼:PCA降維分析R腳本,GSEA軟件使用,CIBERSORT算法R腳本使用。 7.臨床癌癥隊(duì)列中預(yù)后特征的識別和驗(yàn)證臨床收集78對肺腺癌樣本,采用PCR檢測四種免疫相關(guān)lncRNA的表達(dá),并且基于前期構(gòu)建的模型計(jì)算出風(fēng)險(xiǎn)分?jǐn)?shù),并結(jié)合臨床資料分析,體外驗(yàn)證四種免疫相關(guān)lncRNA的模型這篇生信文章相對來說結(jié)構(gòu)思路還是很清晰的,構(gòu)建了一個(gè)四種免疫相關(guān)lncRNA的預(yù)后模型并在體外驗(yàn)證。其實(shí)換一個(gè)套路,做點(diǎn)糖酵解,鐵死亡,缺氧,細(xì)胞焦亡生信的預(yù)后模型分析都是類似的。醫(yī)科堂精心整理模塊化代碼幫助大家復(fù)現(xiàn)論文主要內(nèi)容,具體獲取代碼方式見文末!
01-03 從TCGA數(shù)據(jù)庫中下載數(shù)據(jù),構(gòu)建基因表達(dá)矩陣07-09 對差異基因進(jìn)行GO和KEGG富集分析11-12 對cibersort結(jié)果進(jìn)行可視化腳本13 表達(dá)矩陣融合生存數(shù)據(jù)
|