導(dǎo)語 今天給同學(xué)們分享一篇單細胞測序結(jié)合Bulk測序構(gòu)建預(yù)后模型的生信文章“Comprehensive analysis of scRNA-Seq and bulk RNA-Seq reveals dynamic changes in the tumor immune microenvironment of bladder cancer and establishes a prognostic model”,這篇文章于2023年3月27日發(fā)表在J Transl Med期刊上,影響因子為8.44。 膀胱癌(BLCA)的預(yù)后管理仍然是臨床醫(yī)生面臨的一大挑戰(zhàn)。最近,批量RNA-seq測序數(shù)據(jù)已被用作許多癌癥的預(yù)后標(biāo)志物,但不能準(zhǔn)確檢測腫瘤細胞中的關(guān)鍵細胞和分子功能。在目前的研究中,將大量RNA-seq和單細胞RNA測序(scRNA-seq)數(shù)據(jù)結(jié)合起來,構(gòu)建BLCA的預(yù)后模型。 1.BLCA細胞亞型的鑒定 本研究的總體示意圖如下所示:首先,作者過濾了不合格的細胞,并產(chǎn)生了13,490個關(guān)鍵細胞用于后續(xù)分析(圖1A). 對關(guān)鍵細胞進行了基因方差分析,作者發(fā)現(xiàn)2000個基因變化很大(圖1B)。1對三個單細胞樣品進行PCA(圖1C),并將單細胞樣品分散并分布,得出邏輯結(jié)果。同時,在PCA中,作者還選擇了p值<20.0的05個主成分(PC)進行后續(xù)分析(圖1D)。1然后,使用umap算法將關(guān)鍵細胞分類為19個獨立的細胞集群(圖1E,F).通過“singleR”包、CellMarker數(shù)據(jù)庫和參考文獻[17]尋找標(biāo)記基因,對不同的集群進行注釋,得到七個細胞,即B細胞、內(nèi)皮細胞、T細胞、單核細胞、成纖維細胞、平滑肌細胞和上皮細胞(圖1G)。通過氣泡圖可視化每種細胞類型的重要標(biāo)記基因的表達(圖1H)。散點圖顯示了標(biāo)記基因在不同細胞類型中的表達。此外,作者探索了不同細胞類型中癌癥相關(guān)成纖維細胞(CAFs)的標(biāo)記基因(PDPN,THY1,PDGFRB,PDGFRA和POSTN)的表達,發(fā)現(xiàn)所有標(biāo)記基因在成纖維細胞中均高表達。可以總結(jié)每個已鑒定的標(biāo)記基因在特定細胞中的高表達,進一步說明了細胞類型測定的可靠性。 圖1.單細胞RNA-seq數(shù)據(jù)鑒定細胞集群,揭示BLCA腫瘤中的高細胞異質(zhì)性 2.關(guān)鍵細胞鑒定及其標(biāo)記基因功能富集分析 通過使用FindAllMars和Wilcoxon測試,獲得了474個顯著不同的標(biāo)記基因進行鑒定。通過計算每個細胞顯著不同的標(biāo)記基因的ssGSEA評分,作者發(fā)現(xiàn)所有七個細胞在BLCA中都顯著下調(diào),因此七個細胞被認(rèn)為是后續(xù)分析的關(guān)鍵細胞(圖2A)。2關(guān)鍵細胞的標(biāo)記基因富集了GO和KEGG功能(圖2B-E)。作者注意到,除平滑肌細胞外,所有六種細胞類型的標(biāo)記基因都與細胞活化的正向調(diào)節(jié)有關(guān),包括淋巴細胞和白細胞(圖2B)。2此外,單核細胞和T細胞的標(biāo)記基因與細胞因子-細胞因子受體相互作用有關(guān)。B細胞的標(biāo)記基因與p53信號通路相連。內(nèi)皮細胞、上皮細胞和平滑肌細胞的標(biāo)記基因與局灶粘附和ECM-受體相互作用有關(guān)(圖2E). 對所有注釋的細胞分別進行偽時間分析,以使用 Monocle 2 算法探索其分化方向。結(jié)果表明,BLCA細胞逐漸遵循3個分化方向(圖3A)。上皮細胞比其他細胞分化更早,分化成兩個分支,其中一個由內(nèi)皮細胞主導(dǎo),另一個由平滑肌細胞、成纖維細胞主導(dǎo)(圖3C)。此外,作者推斷了細胞-細胞通訊網(wǎng)絡(luò),以根據(jù)特定的途徑和配體受體預(yù)測細胞間通訊。配體-受體對數(shù)量的熱圖顯示,成纖維細胞、T細胞、單核細胞、內(nèi)皮細胞和上皮細胞的細胞通訊發(fā)生的頻率更高(圖)。3具體而言,內(nèi)皮細胞與上皮細胞之間、內(nèi)皮細胞與成纖維細胞之間以及內(nèi)皮細胞與T細胞之間相互作用的頻率和強度較高(圖3D)。此外,B細胞與其他細胞的相互作用相對罕見。 圖2.基于7個關(guān)鍵細胞的標(biāo)記基因功能富集分析 圖3.具有不同分化模式的三個BLCA細胞亞群的軌跡和細胞間通信分析 3.Bulk-RNA測序數(shù)據(jù)中DEG的鑒定和功能富集分析 共獲得1556個顯著DEG,其中上調(diào)基因708個,下調(diào)基因848個(圖4A,B)。GO分析表明,DEGs主要富集于細胞分裂、細胞器裂變、有絲分裂核分裂等細胞周期相關(guān)功能(圖4C-E)。KEGG富集結(jié)果表明,PI3K-Akt信號通路、MAPK信號通路、貼壁點和細胞周期是DEGs的富集通路(圖4F)。 圖4.BLCA患者和對照組之間DEG的鑒定和功能富集分析 4.識別與BLCA相關(guān)的關(guān)鍵模塊 WGCNA用于鑒定參與BLCA發(fā)育和進展的基因。在共表達網(wǎng)絡(luò)構(gòu)建過程中,當(dāng)無標(biāo)度拓撲的擬合指數(shù)達到5.0時,軟閾值功率β為85(圖5A,B).將MEDissThres設(shè)置為0.2以合并動態(tài)剪切樹算法分析的類似模塊,合并后,最終共有10個模塊可用(圖5C,D)。.基于相關(guān)系數(shù)和P值,作者選擇MEbrown作為關(guān)鍵模塊(包含2334個基因)(圖5E)。關(guān)鍵模塊基因詳見圖5F,具有臨床相關(guān)性的棕色模塊的散點圖。 圖5. BLCA相關(guān)基因由WGCNA篩選 5.基于3個特征基因的預(yù)后模型的構(gòu)建與驗證 使用Ven圖證明了細胞亞型的標(biāo)記基因,BLCA模塊基因和DEG的交叉,共取123個交叉基因并定義為候選基因(圖6A)。然后,利用TCGA-BLCA中的訓(xùn)練集進行單因素Cox回歸分析,10個基因與OS顯著相關(guān)(圖6B)。接下來,使用LASSO算法篩選基因以進行模型構(gòu)建。結(jié)果如圖6C所示,以最小的交叉驗證錯誤篩選3個特征基因:PCOLCE2,MAP1B和ELN。風(fēng)險評分 = 0.09876179 × PCOLCE2 + 0.04635731 × MAP1B + 0.01686333 × ELN。根據(jù)臨界值=0.15,患者分為高風(fēng)險組和低風(fēng)險組(圖6D)。Kaplan-Meier分析顯示,高風(fēng)險評分患者的OS和無病生存期(DFS)明顯低于低風(fēng)險評分的患者(圖6E)。為了進一步評估風(fēng)險模型的有效性,計算了OS的ROC曲線,1、2、3、4和5年的AUC值均大于0.59,表明風(fēng)險模型的有效性更好(圖6F)。作者還在內(nèi)部驗證集和外部驗證集中對模型進行了功能驗證。GSE13507和GSE32548,結(jié)果表明該模型具有準(zhǔn)確性。總之,作者的預(yù)后模型在BLCA中顯示出出色的預(yù)測效率。 圖6.在TCGA隊列中構(gòu)建風(fēng)險特征 6.分析風(fēng)險評分和不同的臨床特征 為分析風(fēng)險評分表達與臨床特征的相關(guān)性,根據(jù)不同組別的臨床特征分別比較患者風(fēng)險評分的差異。結(jié)果表明,風(fēng)險評分在N期、T期和OS狀態(tài)上存在顯著差異(圖7B)。風(fēng)險模型的熱圖和臨床特征如圖7A所示。臨床特征分層分析顯示,臨床M0期,男性,III-IV期,T1-T2期,年齡>60歲和TMB_hight在高危和低風(fēng)險組中生存率存在顯著差異。綜上所述,作者基于3個特征基因的預(yù)后模型具有優(yōu)異的預(yù)后價值。 圖7.風(fēng)險評分與臨床特征的相關(guān)性分析 7.獨立預(yù)后因素的篩查和列線圖的構(gòu)建 為了篩選獨立的預(yù)后因素,對臨床特征和風(fēng)險評分進行了單變量和多變量Cox分析。作者發(fā)現(xiàn)RiskScore和Stage是患者的獨立預(yù)后因素(圖8A,B)。列線圖模型中包括兩個獨立的預(yù)后因素(圖8C)。此外,校準(zhǔn)曲線表明該模型具有較高的預(yù)測效果(圖8D)。因此,作者的結(jié)果表明,風(fēng)險評分是一個獨立的預(yù)后因素,列線圖對預(yù)測BLCA患者的OS具有較高的預(yù)測效果。 圖8.列線圖模型基于單變量和多元cox回歸分析構(gòu)建 8.高危和低危人群之間的 GSEA病 為了分析高風(fēng)險和低風(fēng)險亞組對癌癥進展的影響,作者進行了GSEA以確定兩組之間最重要的富集途徑。結(jié)果表明,高危人群在免疫應(yīng)答中涉及的細胞活化和體液免疫應(yīng)答等免疫過程顯著富集(圖9A)。KEGG表明,趨化因子信號通路、補體和凝血級聯(lián)反應(yīng)等通路在高危組中富集,低危組富集吞噬體相關(guān)通路(圖9B)。作者還使用GSVA分析了高風(fēng)險和低風(fēng)險組的所有基因。結(jié)果表明,高表達組在肌生成、MYC靶點V2、早期雌激素反應(yīng)、胰腺β細胞、DNA修復(fù)、MYC靶點V1、頂端連接、KRAS信號通路、過氧化物酶體、IL6 JAK STAT3和血管生成MYC靶點的標(biāo)記條目中被激活,而低表達組在缺氧、脂肪生成、 血紅素代謝、膽汁酸代謝、干擾素α反應(yīng)途徑、凝血等標(biāo)志物條目(圖9C,D)。 圖9.高危和低危人群之間的生物學(xué)特征 9.評估BLCA免疫治療的可能性 使用ssGSEA估計不同風(fēng)險組中28個免疫細胞的浸潤評分。結(jié)果表明,除天然免疫細胞外,25種免疫細胞的浸潤水平差異具有統(tǒng)計學(xué)意義。killers.cell,Monocyte和T.helper.cell(圖10A)。皮爾遜相關(guān)結(jié)果顯示,預(yù)后基因和風(fēng)險評分均與免疫細胞浸潤顯著相關(guān)(圖10B)。16個GEP基因(炎癥基因)和4個免疫檢查點在高危和低危組中差異顯著(圖10C)。16個差異GEP基因和排名前4的途徑(T細胞活化,T細胞活化調(diào)節(jié),白細胞細胞間粘附調(diào)節(jié),白細胞細胞間細胞粘附)的相互作用網(wǎng)絡(luò)如圖10D所示,它強調(diào)了GEP基因與這些途徑之間的密切聯(lián)系。差異GEP基因的PPI網(wǎng)絡(luò)顯示了每個GEP基因之間的聯(lián)系(圖10E)。PD-1、PD-L1、CTLA-4和TIGIT在高危和低危組中是不同的(圖10F)。通過SubMap,在免疫治療隊列(Roh隊列)中,對ICB進行高危和低風(fēng)險組的反應(yīng)進行評估。作者發(fā)現(xiàn)CTLA-4免疫位點在Roh隊列中是敏感的(圖10G)。作者發(fā)現(xiàn)BLCA患者主要以錯義突變和SNPs為主(圖11A)。高危組和低危組突變結(jié)果顯示,高危組和低危組多數(shù)突變類型為錯義突變。高危組突變比例高于低危組,高危組突變負荷指數(shù)TMB指數(shù)總體高于低危組(圖11B)。最重要的是,作者的結(jié)果表明免疫療法在BLCA中具有發(fā)展?jié)摿Α?/p> 圖10.高低危人群腫瘤免疫微環(huán)境分析 圖11.BLCA中的突變景觀分析 10.高危和低危人群藥敏分析 從GDSC數(shù)據(jù)庫中,作者發(fā)現(xiàn)12種藥物與風(fēng)險評分呈負相關(guān)(R < -0.4和p < 0.05),圖12A中僅顯示前7種藥物。此外,作者探討了12種藥物的靶點和途徑,其中5種沒有相應(yīng)的數(shù)據(jù)。12種化療藥物在高危組和低危組間差異顯著(圖12B)。在CTRP數(shù)據(jù)庫中,藥物星形孢素,CCT036477,XL765,TGX.221和舒尼替尼與風(fēng)險評分的負相關(guān)性最強(圖12C)。同時,5種藥物的AUC值在高危組和低危組均存在顯著差異(圖12D)??傊@些藥物可能對BLCA的治療有希望。 圖12.基于風(fēng)險模型篩選BLCA治療藥物 總結(jié) 通過整合scRNA-seq和批量RNA-seq數(shù)據(jù),作者進行了多種機器學(xué)習(xí)方法,并建立了一種新的BLCA患者OS預(yù)測預(yù)后模型,可用于預(yù)測BLCA患者的生存概率。此外,風(fēng)險評分是一個有希望的獨立預(yù)后因素,與免疫微環(huán)境和臨床病理特征密切相關(guān)??傮w而言,這項研究可以作為BLCA療效的可靠預(yù)測指標(biāo),為未來BLCA的靶向治療開辟了新的途徑。對這篇文章的思路感興趣的老師,歡迎掃碼咨詢! 生信分析定制服務(wù) 請掃描下方二維碼 |
|