在臨床研究領(lǐng)域,組學(xué)方法為疾病的診斷、預(yù)測、治療以及藥物開發(fā)提供了極為重要的信息。常見的組學(xué)研究包括基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等。簡單通俗來說,組學(xué)是基于特定細(xì)分領(lǐng)域進(jìn)行一系列檢測的方法。例如,之前備受矚目的純生物信息學(xué)研究,便是通過測量一系列非編碼RNA的信息,構(gòu)建某些熱門表型(鐵死亡、銅死亡)的非編碼RNA預(yù)測模型。然而,這類研究普遍面臨一個(gè)共性問題,即模型的可解釋性。即模型中的某些RNA、蛋白質(zhì)和代謝物在臨床實(shí)踐中的實(shí)際意義,仍需要進(jìn)一步的基礎(chǔ)和臨床研究加以驗(yàn)證。 與之相反,基于已經(jīng)成熟的臨床指標(biāo)的“組學(xué)”研究則可以更好地從臨床研究的角度解釋統(tǒng)計(jì)結(jié)果。NHANES數(shù)據(jù)庫可以說是一個(gè)臨床組學(xué)的寶庫,其中包含了豐富的信息,如維生素組學(xué)、微量元素組學(xué)、環(huán)境化學(xué)物暴露組學(xué)和性激素組學(xué)等。我們可以探索組學(xué)中單一指標(biāo)與結(jié)局之間的關(guān)系,構(gòu)建基于多個(gè)組學(xué)指標(biāo)診斷和預(yù)測模型,也可以研究多個(gè)指標(biāo)與結(jié)局之間的分類關(guān)聯(lián)。 今天筆者與大家分享一篇《Clinical Nutrition》雜志上的文章,讓我們一起來學(xué)習(xí)一下。 關(guān)鍵信息 這項(xiàng)研究是一項(xiàng)隊(duì)列研究,旨在評估血清中六種維生素(A、D、E、C、B12和B9)的濃度與美國成年人全因死亡率和特定原因死亡率風(fēng)險(xiǎn)之間的關(guān)聯(lián)。主要的統(tǒng)計(jì)學(xué)方法:(1) K均值聚類方法(非監(jiān)督學(xué)習(xí))將參與者分為四種維生素共同暴露模式:低水平暴露(Cluster 1),維生素A / D暴露(Cluster 2),水溶性維生素暴露(Cluster 3)和高水平暴露(Cluster 4);(2) Cox比例風(fēng)險(xiǎn)模型探索維生素/維生素暴露模型和死亡結(jié)局的關(guān)系。研究發(fā)現(xiàn)高循環(huán)維生素D水平與美國成年人的死亡風(fēng)險(xiǎn)降低有關(guān);而中等水平的維生素共同暴露則有助于降低全因和癌癥的死亡風(fēng)險(xiǎn)。 摘要 背景與目的:現(xiàn)有的流行病學(xué)研究探討了循環(huán)中維生素與死亡率之間的關(guān)系,重點(diǎn)關(guān)注單個(gè)維生素的作用,結(jié)果存在爭議。多種維生素共同暴露的聯(lián)合效應(yīng)值得研究。本研究旨在闡明循環(huán)維生素以及這些維生素共同暴露的聯(lián)合效應(yīng)與全因和特因死亡風(fēng)險(xiǎn)的關(guān)聯(lián)。 方法:我們前瞻性地評估了血清中六種維生素(A、D、E、C、B12 和 B9)的濃度與美國成年人全因和特定原因死亡風(fēng)險(xiǎn)的關(guān)聯(lián)。死亡狀況和死亡原因由截至2015年12月31日的NHANES鏈接公共數(shù)據(jù)庫確定。采用無監(jiān)督 K-均值聚類方法將參與者聚類為幾種維生素共同暴露模式。統(tǒng)計(jì)分析采用 Cox 比例風(fēng)險(xiǎn)模型。 結(jié)果:在中位數(shù)為10.9年的隨訪期間,8295名參與者中共有1404人死亡。在多變量調(diào)整中,維生素D水平的增加與全因和特定原因死亡風(fēng)險(xiǎn)的降低有關(guān)。在所有研究的維生素(維生素 D 除外)與全因死亡風(fēng)險(xiǎn)之間均存在 J 型非線性暴露-反應(yīng)關(guān)系。根據(jù)所研究的維生素,產(chǎn)生了以下四種共同暴露模式:低水平暴露(群組 1)、維生素 A/D 暴露(群組 2)、水溶性維生素暴露(群組 3)和高水平暴露(群組 4)。與群組 1 的參與者相比,群組 2 的參與者全因死亡率和癌癥死亡率較低,危險(xiǎn)比(95% 置信區(qū)間 [CIs])分別為 0.67(0.53,0.85)和 0.45(0.29,0.71)。 結(jié)論:這項(xiàng)研究的結(jié)果表明,循環(huán)維生素 D 水平高與美國成年人的死亡風(fēng)險(xiǎn)降低有關(guān)。中等水平的維生素共同暴露可適當(dāng)降低全因和癌癥死亡風(fēng)險(xiǎn)。我們的研究結(jié)果為探索多種維生素共同暴露的聯(lián)合健康效應(yīng)提供了一個(gè)新的視角。未來還需要進(jìn)行調(diào)查,以進(jìn)一步揭示可能的維生素相互作用的潛在機(jī)制。 該研究的亮點(diǎn)薈萃如下: 數(shù)據(jù): NHAENS數(shù)據(jù)庫(維生素變量 人口統(tǒng)計(jì)學(xué)變量 共病變量 全因死亡/心血管死亡/腫瘤死亡結(jié)局)。 統(tǒng)計(jì)方法: K-mean聚類(非監(jiān)督學(xué)習(xí)),Cox風(fēng)險(xiǎn)比例模型,限制性立方樣條(Restricted Cubic Spline, RCS)。將K均值聚類的結(jié)果用于Cox回歸模型,采用RCS探索非線性關(guān)系。 解釋性: 結(jié)合臨床實(shí)踐,對單個(gè)因子和多個(gè)因子的共同暴露模式進(jìn)行了深入解釋。 接下來的統(tǒng)計(jì)分析看起來非?!?/span>花里花俏”,而且工作量比較大,實(shí)質(zhì)上,講透原理并不難。 暴露X是維生素,結(jié)局Y是死亡(是否死亡 時(shí)間t),混雜Z是人口統(tǒng)計(jì)學(xué)變量、共病變量。模型是Cox比例風(fēng)險(xiǎn)模型。 第一步細(xì)化暴露,首先X是VA、VD、VE、VC、VB12以及VB9六種維生素;其次是按照四分位將以上六種維生素轉(zhuǎn)變?yōu)榉诸愖兞?;再次,通過K-mean聚類將維生素的暴露分為4個(gè)類別。 第二步細(xì)化結(jié)局,首先Y是全因死亡、心血管死亡和腫瘤死亡,當(dāng)然Cox模型中包含了隨訪時(shí)間。 第三步細(xì)化協(xié)變量,模型 1 調(diào)整的協(xié)變量包括年齡、性別、種族/民族和貧困指數(shù)。模型2在模型1上進(jìn)一步調(diào)整教育水平、BMI、婚姻狀況、吸煙狀況、飲酒狀況和娛樂身體活動(dòng)水平;模型 3在模型2上進(jìn)一步調(diào)整高血壓、高膽固醇、糖尿病、腦血管疾病、心血管疾病和腫瘤病史。 基本的模型是風(fēng)險(xiǎn)比例模型,在此基礎(chǔ)上,對于連續(xù)變量的X,采用了非線性和線性模型擬合,分類變量的模型,則用了當(dāng)中某一組做參照,其他組與之對比進(jìn)行擬合。 上述統(tǒng)計(jì)方法中的主要部分可以通過LIGHT Scholar實(shí)現(xiàn),NHAENS數(shù)據(jù)庫的挖掘會(huì)在后續(xù)課程進(jìn)行講解,敬請期待! 接下來從數(shù)據(jù)分析角度來看這篇文章的亮點(diǎn): 1.研究人群基線特征和聚類 Table S1描述了各個(gè)數(shù)據(jù)變量的主要來源,數(shù)據(jù)來源十分清晰,讓審稿人無所挑剔,類似的表格可以在自己開展NHANES相關(guān)研究的提取數(shù)據(jù)過程。 納排流程十分清晰,同時(shí)在調(diào)整不同的協(xié)變量Z的模型,選擇的是不同的樣本量,不是多重插補(bǔ)的方式,簡單有效而真實(shí)。 6種維生素之間的相關(guān)性分析:計(jì)算偏相關(guān)系數(shù)并用熱圖可視化結(jié)果,該熱圖的存在不僅僅考慮了其他維度數(shù)據(jù)協(xié)變量對結(jié)局的影響,還考慮到維生素組學(xué)變量之間的關(guān)系。該模塊可以通過LIGHT Scholar的科研繪圖Correlation plot模塊實(shí)現(xiàn)。 上圖是核心內(nèi)容之一,基于K-mean聚類對組學(xué)數(shù)據(jù)人群進(jìn)行分類,分類后再用于Cox回歸模型。除了LIGHT Scholar的平臺可以用到KNN聚類、隨機(jī)森林分類模型、多層感知器(MLP)分析等。K均值聚類是一種無監(jiān)督的機(jī)器學(xué)習(xí)算法,它可以幫助我們將一組觀測值(例如患者的臨床特征)劃分為若干個(gè)不同的組,稱為“簇”。同屬地說使用算法將這些患者劃分為不同的類,每個(gè)類代表一個(gè)具有類似特征的患者群體。Table S2列出各類中6種維生素的細(xì)節(jié)以及命名細(xì)節(jié)。Table 1為各個(gè)類中的6種維生素的分布情況,Figure 4將結(jié)果以小提琴的形式可視化(LIGHT Scholar的科研繪圖Violin Plot模塊實(shí)現(xiàn))。 Table 2 中呈現(xiàn)了以上4類的基線特征比較結(jié)果,LIGHT Scholar統(tǒng)計(jì)分析模塊的Step 1可以復(fù)現(xiàn)。 2. 循環(huán)維生素和死亡(全因/心血管/腫瘤)的關(guān)系(直線關(guān)系 曲線關(guān)系) 直線關(guān)系: Table S3 展示了每種維生素與死亡之間的關(guān)系,采用了3個(gè)Cox回歸模型調(diào)整混雜因素,Table S4將6種維生素基于四分位數(shù)分成4個(gè)水平(Q1 Q2 Q3 Q4),將自變量轉(zhuǎn)變?yōu)樽鳛榉诸愖兞窟M(jìn)行分析,以Q1作為參照,使用Cox回歸模型研究Q2 Q3 Q4與死亡結(jié)局的關(guān)系。Figure 5 實(shí)質(zhì)上是將Table S4的結(jié)果轉(zhuǎn)變到整合的森林圖實(shí)現(xiàn)可視化,LIGHT Scholar的科研繪圖 Forest Plot模塊可實(shí)現(xiàn)。 曲線關(guān)系: Figure6 通過限制性立方樣條(RCS)展示了六種維生素與死亡風(fēng)險(xiǎn)之間的劑量反應(yīng)關(guān)系,Table S5則展示了6種維生素與多種死亡分析之間的線性P值與非線性P值。 3. 循環(huán)水平維生素分類和死亡(全因/心血管/腫瘤)的關(guān)系 Table3 以分類作為自變量,進(jìn)行Cox回歸分析以探究不同維生素聚類和死亡風(fēng)險(xiǎn)之間的關(guān)系,Figure 7以森林圖的形式可視化。進(jìn)一步敏感性分析Table S6展示Model3人群 分層分析(季節(jié)):結(jié)果顯示沒有季節(jié)變化;Table S7基于Model3人群和 Model1兩個(gè)人群分析的結(jié)果基本一致。 Tips: 文章的核心部分在LIGHT Scholar中可以復(fù)現(xiàn),這些工具包括了KNN聚類、隨機(jī)森林分類模型、多層感知器(MLP)分析、科研繪圖(Forest Plot、Correlation Plot、Violin Plot)等。 小伙伴們快來LIGHT Scholar試試吧! 今天(8.13)晚上,即將開啟第三節(jié)課啦! 會(huì)員寶寶們晚上騰訊會(huì)議不見不散??! https://www./ |
|