導(dǎo)語(yǔ) 今天給同學(xué)們分享一篇孟德?tīng)栯S機(jī)化+轉(zhuǎn)錄組的生信文章“Exploring the causality and pathogenesis of systemic lupus erythematosus in breast cancer based on Mendelian randomization and transcriptome data analyses”,這篇文章于2023年1月16日發(fā)表在Front Immunol期刊上,影響因子為8.786。 乳腺癌是全球女性最常見(jiàn)的癌癥,與慢性炎癥密切相關(guān)。由于女性中SLE的高發(fā)病率,積累的觀察性或隊(duì)列研究已經(jīng)探討了SLE和乳腺癌之間的關(guān)聯(lián)。然而,觀察性研究得出了相互矛盾的結(jié)論,因?yàn)榻Y(jié)果可能受到許多潛在混雜因素的影響,包括樣本大小和抗SLE免疫抑制治療。SLE和乳腺癌的流行病學(xué)模式在不同種族人群之間也可能有所不同。因此,需要采用更加精心設(shè)計(jì)的方法來(lái)評(píng)估系統(tǒng)性紅斑狼瘡與乳腺癌風(fēng)險(xiǎn)之間的因果關(guān)系。 圖1 研究設(shè)計(jì)概述 1. SNP的選擇 總的來(lái)說(shuō),這項(xiàng)研究分析了共計(jì)243,218名歐洲血統(tǒng)個(gè)體(128,178例患者和115,040例對(duì)照組)以及107,936名東亞血統(tǒng)個(gè)體(9,774例患者和98,162例對(duì)照組)。作者從全基因組關(guān)聯(lián)研究中提取了與SLE顯著相關(guān)的IVs(p< 5 × 10 ?8 ),并去除了連鎖不平衡(r 2 <0.001,10,000-kb)。此外,作者的分析中F統(tǒng)計(jì)量大于100,表明這些IVs能夠強(qiáng)有力地預(yù)測(cè)SLE的發(fā)病率。 2. 遺傳易感性與SLE和乳腺癌風(fēng)險(xiǎn) MR分析顯示歐洲隊(duì)列中SLE與乳腺癌之間不存在因果關(guān)聯(lián)(乳腺癌:OR 0.9985,95%CI 0.9873-1.0099,p=0.79;ER+乳腺癌:OR 0.9974,95%CI 0.9850-1.0101,p=0.69;ER-乳腺癌:OR 1.009,95%CI 0.99-1.02,p=0.22)。沒(méi)有證據(jù)表明其他MR方法基于乳腺癌風(fēng)險(xiǎn)的增加。然而,注意到東亞人群中SLE和乳腺癌的遺傳易感性的因果推斷(IVW:OR:0.95,95%CI:0.92-0.98,p=0.006;加權(quán)中位數(shù):OR:0.93,95%CI:0.88-0.97,p=0.002;MR-PRESSO:OR 0.95,95%CI:0.92-0.98,p=0.004)(圖2)。多變量MR分析也支持了SLE與東亞人群中乳腺癌的顯著關(guān)聯(lián)發(fā)現(xiàn)(SNPs:25,OR:0.95,95%CI:0.92-0.98,p=0.0013),在調(diào)整混雜因素(吸煙,特征ID:ieu-b-4877)后。 圖2 系統(tǒng)性紅斑狼瘡對(duì)東亞人乳腺癌風(fēng)險(xiǎn)的因果關(guān)系 3. MR估計(jì)的敏感性分析 首先,作者進(jìn)行了MR-Egger回歸分析,以研究水平多效性,并且結(jié)果證實(shí)多效性不太可能對(duì)因果關(guān)系產(chǎn)生偏倚(所有p值>0.05)。其次,MR-PRESSO測(cè)試的結(jié)果與無(wú)異常值的IVW方法一致,表明原始結(jié)果可靠。第三,考慮到東亞隊(duì)列中SLE和乳腺癌之間的潛在關(guān)系,作者進(jìn)行了逐個(gè)排除分析和Cochrane Q檢驗(yàn)。逐個(gè)排除分析發(fā)現(xiàn)沒(méi)有單個(gè)SNP驅(qū)動(dòng)SLE和乳腺癌之間的因果關(guān)系(圖2)。Cochrane Q檢驗(yàn)的p值均大于0.05(IVW測(cè)試的Q值:32.93,p=0.2;MR-Egger測(cè)試的Q值:32.8,p=0.17),表明SNP之間沒(méi)有異質(zhì)性。 4. 乳腺癌患者中SLE相關(guān)DEGs的鑒定 在標(biāo)準(zhǔn)化微陣列結(jié)果后(圖3A、B),識(shí)別出SLE和乳腺癌相關(guān)數(shù)據(jù)集之間的447個(gè)常見(jiàn)差異表達(dá)基因(圖3C)。通過(guò)聚類,WGCNA(軟閾值功率=6)進(jìn)一步去除了灰色模塊中的61個(gè)明顯異常值,并識(shí)別出386個(gè)感興趣的中心基因(圖3D、E)。 圖3 5. 功能特點(diǎn)分析 為了進(jìn)一步了解乳腺癌中386個(gè)SLE-DEGs的潛在功能,作者進(jìn)行了GO和KEGG富集分析。GO分析顯示DEGs富集在細(xì)胞周期、細(xì)胞增殖和對(duì)激素的反應(yīng)方面(圖3F)。KEGG富集分析主要涉及與癌癥和細(xì)胞周期相關(guān)的途徑,包括代謝途徑、微小RNA、轉(zhuǎn)錄調(diào)控失調(diào)、蛋白聚糖和中心碳代謝(圖3G)。 6. PPI網(wǎng)絡(luò)和關(guān)鍵基因分析 首先,對(duì)386個(gè)常見(jiàn)的差異表達(dá)基因構(gòu)建了PPI網(wǎng)絡(luò)。其次,使用Cytoscape的Cytuhubba插件計(jì)算了前20個(gè)中心基因(AURKA、UBE2C、CDC20、PTTG1、CCNB2、MELK、NDC80、CENPF、PRC1、KIF23、TOP2A、RACGAP1、NUSAP1、HMMR、ASPM、KIF15、TTK、DLGAP5、CCNA2和NCAPG)(圖4A)。第三,斯皮爾曼相關(guān)分析顯示這二十個(gè)中心基因之間存在顯著密切的關(guān)聯(lián)(所有p值<0.0001)(圖4B)。 圖4 7. 預(yù)測(cè)模型的構(gòu)建和驗(yàn)證 LASSO回歸方法被用來(lái)優(yōu)化20個(gè)中心基因。最終,選擇了最有價(jià)值的五個(gè)預(yù)測(cè)基因(RACGAP1、HMMR、TTK、TOP2A和KIF15)來(lái)構(gòu)建SLEscore(圖4C、D)。SLEscore的五個(gè)中心基因在腫瘤樣本中均顯著上調(diào)(圖4E-G)。根據(jù)SLEscore,乳腺癌患者被分為兩個(gè)亞組,其中SLEscore high 與五個(gè)預(yù)后分子的高表達(dá)水平相關(guān)(圖5A)。與低SLEscore組相比,高SLEscore組與明顯更差的總生存期相關(guān)(圖5B)。ROC曲線表明,SLEscore可以作為預(yù)測(cè)乳腺癌患者總生存期的敏感標(biāo)志物(3年AUC:0.81,5年AUC:0.91)(圖5C)。此外,多變量COX回歸分析表明,SLEscore是乳腺癌患者的獨(dú)立風(fēng)險(xiǎn)因素(HR 7.1,95%CI 1.50-33.4,p=0.013)(圖5D)。作者建立的SLEscore的C指數(shù)為0.73(標(biāo)準(zhǔn)誤差:0.043)。在GSE42568數(shù)據(jù)集中進(jìn)一步驗(yàn)證了SLEscore,表明使用TCGA數(shù)據(jù)庫(kù)構(gòu)建的SLEscore是乳腺癌患者的獨(dú)立預(yù)后因子(HR 1.92,95%CI 1.08-3.42,p=0.02)(圖5E)。隨后,作者通過(guò)整合SLEscore、年齡和TNM分期為乳腺癌患者建立了一個(gè)預(yù)測(cè)模型,該模型在預(yù)測(cè)乳腺癌患者1年、3年和5年的生存率方面表現(xiàn)良好(圖6A、B)。 圖5 圖6 8. TME細(xì)胞的探索,ESTIMATE評(píng)分,ICB和PANoptosis Spearman相關(guān)分析揭示了20種分子與TME浸潤(rùn)細(xì)胞之間的顯著關(guān)聯(lián)(圖6C)。值得注意的是,高SLE得分與較低的樹(shù)突狀細(xì)胞、嗜酸性粒細(xì)胞、肥大細(xì)胞、CD4+ T細(xì)胞和輔助T細(xì)胞表達(dá)顯著相關(guān)(圖6D)。ESTIMATE得分與五個(gè)中心基因的表達(dá)水平呈負(fù)相關(guān)(所有p值<0.05)(圖6E),表明其與疾病結(jié)果和腫瘤浸潤(rùn)免疫環(huán)境的關(guān)系。SLE得分與8種ICB和PANoptosis基因模式的相關(guān)性顯著,這些已被證明是乳腺癌患者預(yù)后生物標(biāo)志物。 總結(jié) 作者的MR分析表明,SLE患者在東亞人群中對(duì)乳腺癌的風(fēng)險(xiǎn)較低。本研究還為乳腺癌和SLE患者的分層提供了路線圖,有助于改進(jìn)個(gè)體化隨訪和個(gè)性化決策的策略。 |
|