【歡迎你閱讀浙中大鄭老師團隊撰寫的統(tǒng)計科普文章】 今天分享的兩篇文章,同一天發(fā)表在同一個一區(qū)雜志,統(tǒng)計學方法具有很高的相似性。兩篇文章均使用了Cox回歸和RCS分析暴露因素與結(jié)果之間的關(guān)系,并用森林之神Boruta算法篩選關(guān)鍵特征變量,構(gòu)建并評估機器學習預(yù)測模型。 2024年12月18日,福建醫(yī)科大學學者在期刊《Cardiovascular Diabetology》(醫(yī)學一區(qū)top,IF=8.5)發(fā)表了一篇題為:“Association and predictive ability between significant perioperative cardiovascular adverse events and stress glucose rise in patients undergoing non-cardiac surgery”的研究論文,旨在探究應(yīng)激性高血糖比率(SHR)與非心臟手術(shù)患者圍手術(shù)期主要不良心血管事件(MACE)方面的關(guān)聯(lián)和預(yù)測能力。如果你需要全文,請公眾號后臺回復(fù)關(guān)鍵詞“pdf”。如果你想了解臨床預(yù)測模型相關(guān)課程,請聯(lián)系鄭老師團隊,助教微信:aq566665 在該項研究中,研究團隊使用了來自INSPIRE數(shù)據(jù)庫(版本1.1)的患者圍手術(shù)期數(shù)據(jù),經(jīng)過納排,最終納入INSPIRE數(shù)據(jù)庫2011年至2020年期間,5,609例接受非心臟手術(shù)年齡≥18歲的患者的數(shù)據(jù),并根據(jù)SHR的三分位數(shù)被分為三組。 非心臟手術(shù)包括胃腸道、骨科、神經(jīng)外科、產(chǎn)科、婦科、耳鼻喉科、胸外科和泌尿外科手術(shù)。主要終點:術(shù)后30天內(nèi)MACE的發(fā)生率,包括心源性死亡、圍手術(shù)期心肌梗死、急性心力衰竭和圍手術(shù)期卒中。使用Kaplan-Meier生存曲線評估不同SHR三分位數(shù)的MACE發(fā)生率,并使用log-rank檢驗評估組間差異。研究結(jié)果顯示,隨著SHR值的升高,圍手術(shù)期MACE和心源性死亡的發(fā)生率逐漸增加。構(gòu)建單變量和多變量Cox比例風險回歸模型,進一步探究SHR作為連續(xù)及分類變量與MACE風險之間的相關(guān)性。模型3:調(diào)整年齡、性別、BMI、ASA分級、急診狀態(tài)、手術(shù)類型、麻醉類型、糖尿病狀態(tài)、高血壓狀態(tài)、高脂血癥狀態(tài)、頸動脈狹窄狀態(tài)、瓣膜性心臟病狀態(tài)、房顫狀態(tài)、COPD、腎功能不全狀態(tài)、肝功能不全狀態(tài)、既往心肌梗死、IOH狀態(tài)、β受體阻滯劑狀態(tài)、胰島素狀態(tài)和降糖藥物狀態(tài)。同時,限制性立方樣條(RCS)分析潛在非線性關(guān)聯(lián)。結(jié)果顯示,SHR與圍手術(shù)期MACE和心臟死亡之間存在的J形非線性關(guān)聯(lián)目前,RCRI在臨床上經(jīng)常用于評估非心臟手術(shù)患者的心臟并發(fā)癥風險。研究團隊將SHR分別作為連續(xù)變量或由拐點確定的分類變量納入RCRI模型,通過ROC曲線、AUC、C-統(tǒng)計量、NRI、IDI及似然比檢驗等方法評估SHR納入是否能提升預(yù)測性能。結(jié)果顯示,SHR顯著改善了RCRI模型對術(shù)后30天MACE的預(yù)測性能,將AUC從0.778增加至0.825。√數(shù)據(jù)處理 首先,數(shù)據(jù)缺失超過20%的變量直接剔除;對于數(shù)據(jù)缺失少于20%的變量,使用多重插補鏈式方程(MICE)進行插補,確保估計的無偏性。√共線性 計算了方差膨脹因子(VIF)評估變量之間的多重共線性。√特征篩選 基于“森林之神”Boruta算法進行特征篩選,重要變量(如綠色區(qū)域所示)被納入機器學習模型的開發(fā)中。在填補完缺失數(shù)據(jù)后,數(shù)據(jù)被隨機分為訓(xùn)練集(70%)和驗證集(30%),使用10機器學習算法構(gòu)建預(yù)測模型,并用網(wǎng)格搜索和隨機搜索方法進行超參數(shù)調(diào)整,優(yōu)化模型性能。 10機器學習算法包括:分類提升(CatBoost)、決策樹、梯度提升機(GBM)、k-最近鄰(KNN)、輕梯度提升機(LightGBM)、神經(jīng)網(wǎng)絡(luò)(NN)、隨機森林(RF)、支持向量機(SVM)和極端梯度提升(XGBoost)。√模型性能評估
研究團隊使用AUC值、DCA和校準曲線評估預(yù)測模型的性能,結(jié)果顯示,納入SHR后,模型的預(yù)測性能顯著提升,AUC值有所增加。 其中決策樹(AUC = 0.893)和隨機森林(AUC = 0.889)模型預(yù)測性能最佳。同一天,同一期刊《Cardiovascular Diabetology》(醫(yī)學一區(qū)top,IF=8.5)發(fā)表了一篇題為:“Exploring the prognostic impact of triglyceride-glucose index in critically ill patients with first-ever stroke: insights from traditional methods and machine learning-based mortality prediction”的研究論文,旨在探索TyG與ICU全因死亡率和其他預(yù)后之間的關(guān)系,并開發(fā)機器學習(ML)模型來預(yù)測首次卒中患者的ICU全因死亡率。在該項研究中,研究團隊團隊主要從eICU協(xié)作研究數(shù)據(jù)庫納入3173名符合條件的年齡≥17歲、ICU住院時間≥6h、首次卒中的患者。次要結(jié)果:醫(yī)院全因死亡率、ICU和住院時間、格拉斯哥昏迷評分(GCS)和GCS的單個要素(睜眼、言語反應(yīng)、運動反應(yīng))。使用限制性立方樣條分析(RCS)評估變量TyG與ICU全因死亡率之間的整體和非線性關(guān)系,并將參考點設(shè)置為最佳截止點。研究結(jié)果顯示,TyG與ICU全因死亡率之間存在線性關(guān)系(P=0.020),但不存在非線性關(guān)系(P-non-linear=0.356)。根據(jù)最佳截止點對TyG進行分類,繪制Kaplan-Meier曲線以評估生存差異。結(jié)果發(fā)現(xiàn),高TyG組(TyG ≥ 9.265)與低TyG組(TyG < 9.265)之間的生存概率存在顯著差異(log-rank P< 0.001)。通過構(gòu)建多元Cox模型,并調(diào)整潛在混雜因素,研究團隊發(fā)現(xiàn)高TyG組與低TyG組相比,ICU(HR 1.92, 95% CI 1.38–2.66)和醫(yī)院(HR 1.69, 95% CI 1.32–2.16)全因死亡率均顯著升高。模型Ⅱ:調(diào)整人口統(tǒng)計學(年齡、性別、種族和BMI)和嚴重程度評分(APACHE IV);模型Ⅲ:進一步調(diào)整合并癥(糖尿病、高血壓、冠心病、慢性腎病、心力衰竭、心肌梗死、心房顫動、呼吸衰竭、急性腎損傷、肝硬化和敗血癥)、實驗室檢查(HDL-C和LDL-C)、治療(抗血小板藥物、抗凝劑、血管加壓劑、溶栓和機械通氣)。這一結(jié)果揭示了TyG作為獨立風險因子在預(yù)測卒中患者預(yù)后中的重要性。進一步在不同亞組[包括年齡(≥60歲和< 60歲)、性別、BMI(≥30和< 30 kg/m2)]中探討TyG與ICU全因死亡率的關(guān)聯(lián),研究結(jié)果顯示,在不同亞組,TyG與ICU全因死亡率之間無顯著相互作用。具體而言,隨著TyG值增加,患者的住院時間延長,神經(jīng)功能更差。二、構(gòu)建機器學習預(yù)測首次中風患者 ICU 全因死亡率納入缺失比例小于30%的協(xié)變量,并使用Python中的“miceforest”對缺失數(shù)據(jù)進行乘法插值。在填補完缺失數(shù)據(jù)后,研究團隊按照7:3的比例將主要隊列劃分為訓(xùn)練集和內(nèi)部驗證集。此外,研究團隊招募了2021年10月至2024年6月天津醫(yī)科大學總醫(yī)院神經(jīng)內(nèi)科ICU和綜合ICU收治的、符合條件的201名首次腦卒中患者,用于預(yù)測模型的外部驗證。鑒于ICU死亡人數(shù)有限,通過Boruta法,最終選擇了7個重要預(yù)測特征(MV、RFA、TyG、HDL-C、血管加壓劑、性別和LDL-C),其中TyG被認為是第三個重要特征。Pearson相關(guān)性和方差膨脹因子檢驗表明它們之間沒有強相關(guān)性或多重共線性使用七種機器學習算法構(gòu)建預(yù)測模型(包括光梯度增強機、隨機森林[RF]、邏輯回歸、支持向量機、多層感知器、高斯樸素貝葉斯和k-最近鄰),并用隨機搜索和手動微調(diào)與5倍交叉驗證,獲得每個ML模型的最佳超參數(shù)。考慮到隊列中陽性和陰性事件的不平衡,我們在ML模型中應(yīng)用了類別權(quán)重或合成少數(shù)過采樣技術(shù)。使用多個指標評估模型的性能,包括AUC值、DCA曲線、精確度、召回率、F1評分、G均值、靈敏度和特異性。最終,在內(nèi)部驗證集中,隨機森林(RF)預(yù)測性能最佳(AUC=0.900),在外部驗證集中RF仍有最佳的預(yù)測性能(AUC=0.776)。使用SHAP法解釋特征對預(yù)測模型性能的重要性,并繪制相關(guān)圖以觀察特定特征對ML模型結(jié)果的邊際效應(yīng)。結(jié)果顯示前三位是:MV、TyG和RFA(TyG在內(nèi)部驗證隊列和外部驗證隊列中分別為第二位和第三位)。將RF嵌入到一個Web平臺中,該平臺具有易于使用的界面,其中包含與模型中的七個特征對應(yīng)的輸入(http://162.62.58.247:3030/)。通過輸入特定于特定患者的信息,將輸出其結(jié)果發(fā)生的概率。看下來諸位應(yīng)該有感覺,兩篇文章的思路如出一轍!所以,只要研究的套路是正確的,又有臨床意義,就可以復(fù)制。
|