微生物組學(xué)分析已成為近年來的研究熱點(diǎn)之一。R語言作為微生物組學(xué)分析的主要平臺,具有相當(dāng)完善的各類分析功能包。然而,使用R語言進(jìn)行微生物組分析依然具有較高的門檻,陡峭的學(xué)習(xí)曲線、復(fù)雜的數(shù)據(jù)預(yù)處理與兼容性各異的分析輸入格式制約了微生物組學(xué)分析效率。 為此,我們開發(fā)了一站式微生物組分析R語言高效解決方案:LorMe包。通過易于上手的數(shù)據(jù)封裝成為高兼容性的分析輸入對象,一條代碼即可完成各類微生物組分析,全面的輸出結(jié)果兼容深度數(shù)據(jù)探索的同時,也可直接用于論文制圖和文章寫作。LorMe包已應(yīng)用于LorMe實(shí)驗(yàn)室新生培訓(xùn),助力各位學(xué)術(shù)新秀快速熟悉和上手微生物組分析。 除了前面推送介紹的微生物組一鍵分析功能,LorMe包還配置了一系列獨(dú)立工具以方便微生物組分析。這些工具主要包括數(shù)據(jù)過濾(已在【LorMe R包】教程1:微生物組數(shù)據(jù)清洗、封裝與配置介紹使用方法)、配色選擇、tb-RDA分析(【LorMe R包】教程6:獨(dú)立工具介紹(一))、顯著性差異檢驗(yàn)及快速制圖(柱狀圖、箱線圖、小提琴圖)。 進(jìn)行顯著性差異檢驗(yàn)是科學(xué)研究中一項基本且重要的分析方法。這項工作并非簡單地使用t檢驗(yàn)或ANOVA就能完成,而是需要根據(jù)數(shù)據(jù)的特性、處理分組的數(shù)量、數(shù)據(jù)變量的資料類型以及數(shù)據(jù)分布(是否滿足正態(tài)分布和方差齊性)等因素,選擇恰當(dāng)?shù)臋z驗(yàn)方法。為了更好地理解這一過程,我們使用LorMe統(tǒng)計分析訓(xùn)練營中的一張圖來進(jìn)行步驟概覽:
選擇合適的顯著性差異檢驗(yàn)方法是一個系統(tǒng)的工程,本推送不再過多介紹,大家可以自行去了解。從設(shè)計理念來說,LorMe包希望大多數(shù)使用者可以簡單、快捷的完成數(shù)據(jù)的顯著性差異檢驗(yàn)。因此,對于大家使用頻率最高的單因子連續(xù)型數(shù)據(jù)差異檢驗(yàn),LorMe包內(nèi)置auto_signif_test這個顯著性差異檢驗(yàn)工具,專門用于分析一些獨(dú)立數(shù)據(jù),包括表型數(shù)據(jù)、環(huán)境因子數(shù)據(jù)以及特別關(guān)注的某些關(guān)鍵物種在處理組之間的差異。使用者僅需提供數(shù)據(jù)框并指定標(biāo)簽、數(shù)據(jù)所在列的位置,該功能即可自動進(jìn)行前置的數(shù)據(jù)特征判斷并選擇合適的顯著性差異檢驗(yàn)方法,并最終輸出包括數(shù)據(jù)分布(正態(tài)分布假定和方差齊性檢驗(yàn)結(jié)果)、各處理的數(shù)據(jù)基本特征(均值、中位數(shù)、方差和標(biāo)準(zhǔn)誤)、顯著性檢驗(yàn)結(jié)果及分析結(jié)果報告(默認(rèn)打印在控制臺,也可輸出至本地)在內(nèi)的各項結(jié)果。 # 數(shù)據(jù)準(zhǔn)備,下面將展示各類不同的顯著性檢驗(yàn)及多重比較方式 # 讀取棉花產(chǎn)量示例數(shù)據(jù), 這是一個經(jīng)典的coloum table data("cotton", package = "agricolae") #大家自行安裝"agricolae"這個包 ### 隨機(jī)設(shè)計兩組比較 ### sig_results <- auto_signif_test( data = cotton, # 輸入數(shù)據(jù)框 treatment_col = 1, # 分組處理標(biāo)簽在第幾列 value_col = 5 # 數(shù)值在第幾列 ) ### 成對設(shè)計兩組比較### sig_results <- auto_signif_test( data = cotton, treatment_col = 1, value_col = 5, paired = TRUE, # 成對設(shè)計需指定該參數(shù)為TRUE subject_col = 2 # 配對信息標(biāo)簽在第幾列 ) ### 隨機(jī)設(shè)計多組比較 ### sig_results <- auto_signif_test( data = cotton, treatment_col = 2, value_col = 5 ) head(sig_results) # 查看輸出結(jié)果 ### 如不顯著則默認(rèn)不進(jìn)行多重比較,可選擇執(zhí)行事前檢驗(yàn)進(jìn)行多重比較### sig_results <- auto_signif_test( data = cotton, treatment_col = 2, value_col = 5, prior = TRUE # 是否執(zhí)行事前檢驗(yàn) ) head(sig_results) # 查看輸出結(jié)果 print(sig_results$basicdata) # 查看統(tǒng)計量匯總 print(sig_results$anova_model) # 提取 ANOVA 模型 print(sig_results$anova_summary) # 查看 ANOVA 匯總 print(sig_results$multiple_comparison_model) # 提取多重比較模型 print(sig_results$comparison_results) # 查看兩兩比較 print(sig_results$comparison_letters) # 查看顯著性字母標(biāo)記(這個數(shù)據(jù)框可直接用于ggplot等可視化) ## 指定多重比較方法(注意,不了解多重比較原理請勿隨意更改!以免執(zhí)行錯誤的檢驗(yàn)方式) sig_results <- auto_signif_test( data = cotton, treatment_col = 2, value_col = 5, prior = TRUE, comparison_method = "LSD" # 指定多重比較方法的參數(shù) ) head(sig_results) # 查看輸出結(jié)果 print(sig_results$comparison_letters) # 查看顯著性字母標(biāo)記
除以上基本使用方式之外,還可選擇將報告輸出至本地,方便寫文章或方案展示時進(jìn)行回溯。 data("Three_group") sig_results <- auto_signif_test( data = Three_group$Groupfile, treatment_col = 2, value_col = 4, prior = TRUE, output = "file", # 輸出方式改為輸出成本地文件 output_dir = "./", # 輸出路徑,此處選擇了當(dāng)前工作路徑 filename = "yield_report" # 文件名,不需要后綴 )
此時,控制臺將不顯示分析報告,取而代之的是R語言的工作路徑下會出現(xiàn)一個"yield_report.txt"的文件,包含了詳細(xì)的分析報告。這里我們以這個報告為例,為大家詳細(xì)解讀分析結(jié)果(以下為純文本,請勿以代碼形式運(yùn)行)。 # 數(shù)據(jù)分布 ###Distribution hypothesis#### Normality Test (Shapiro-Wilk): Passed (P = 0.692 ) # 符合正態(tài)分布 Equal Variance Test (Brown-Forsythe): Passed (P = 0.635 ) # 符合方差齊性 # 數(shù)據(jù)基本特征 (包含處理名、樣本數(shù)N,均值Mean,標(biāo)準(zhǔn)差Sd和均值標(biāo)準(zhǔn)誤SEM) Treatment_Name N Mean Sd SEM BF 5 1893.672 79.66296 35.62636 CF 5 1564.200 74.51380 33.32358 OF 5 1691.078 43.61900 19.50701 #ANOVA模型 Df Sum Sq Mean Sq F value Pr(>F) Between Groups 2 276156.82 138078.412 30.015 2.13812731607719e-05 Residuals 12 55204.44 4600.37 Total 14 331361.26 # 分析結(jié)果概覽 ###Data overview#### ###One Way Analysis of Variance begin#### ###Statistics on ###Dependent Variable: Yield.kg. #### # 分析結(jié)論 # 此處告訴我們組間有顯著差異 ###Conclusion#### The differences in the mean values among the treatment groups are greater than would be expected by chance; there is a statistically significant difference (P = 2.13812731607719e-05 ) # 執(zhí)行的多重比較方法 ###Multiple Comparison Procedures#### # 此處告訴我們使用了Bonferroni法進(jìn)行多重比較 All Pairwise Multiple Comparison Procedures (Bonferroni Method) with alpha=0.05 # 多重比較方法的數(shù)據(jù)矯正情況 ###Bonferroni adjusted LSD statistics#### MSerror Df Mean CV t.value MSD 4600.37 12 1716.317 3.951836 2.779473 119.2309 # 組間多重比較結(jié)果(兩兩比較的均值差異、差異的95%CI和校正后p值) ###Comparions on Group #### diff lwr.ci upr.ci pval CF-BF -329.4720 -448.702906 -210.24109 1.707623e-05 OF-BF -202.5936 -321.824506 -83.36269 1.483805e-03 OF-CF 126.8784 7.647494 246.10931 3.591185e-02 # 顯著性字母標(biāo)記 ###Labels#### compare Letters type Mean std n se LCL UCL Min Max Q25 Q50 Q75 BF BF a Group 1893.672 79.66296 5 30.33272 1827.583 1959.761 1811.304 1999.404 1829.916 1878.228 1949.508 OF OF b Group 1691.078 43.61900 5 30.33272 1624.989 1757.168 1655.280 1743.192 1656.072 1667.160 1733.688 CF CF c Group 1564.200 74.51380 5 30.33272 1498.111 1630.289 1441.440 1622.808 1549.152 1590.732 1616.868
注:在某些研究中,會對各組與CK進(jìn)行差異分析,此時需使用Dunnett檢驗(yàn)。本功能將不包括這種特殊用法。該檢驗(yàn)的實(shí)現(xiàn)代碼也比較簡單,大家可以自行搜索關(guān)鍵詞進(jìn)行學(xué)習(xí)。 完成自動的顯著性差異檢驗(yàn)后,您也許依舊為如何實(shí)現(xiàn)美觀的可視化圖形而煩惱。為此,LorMe包也內(nèi)置了獨(dú)立數(shù)據(jù)組間比較的快捷制圖功能。該功能整合上述顯著性檢驗(yàn),可直接生成顯著性差異檢驗(yàn)結(jié)果及包括柱狀圖、箱線圖、小提琴圖在內(nèi)的可視化圖形。 #我們使用經(jīng)典的鳶尾花數(shù)據(jù) data("iris") # 一鍵制圖 results=compare_plot(inputframe=iris, treat_location=5, #第5列為處理標(biāo)簽 value_location=1, #第1列為數(shù)值標(biāo)簽 ylab_text = "Sepal Length") #提取統(tǒng)計量信息 results$Statistics #提取可視化圖像 results$Barplot results$Boxplot results$Violinplot 此外,該函數(shù)還包括指定配色、分面模式、是否顯示數(shù)據(jù)點(diǎn)、更改Y軸標(biāo)題等參數(shù),大家可通過調(diào)用函數(shù)說明進(jìn)行探索。至此,LorMe包的主要功能及教程均已介紹完畢。在發(fā)布教程期間,陸續(xù)收到了各位LorMe包用戶的提問、意見交流及各類BUG反饋,我們也會根據(jù)大家的反饋逐步對LorMe工具包進(jìn)行完善。如果大家有各類疑問、意見和建議,可以在公眾號留言或通過notion說明頁面添加作者VX進(jìn)行交流。LorMe工具包的預(yù)印本、正式期刊投稿均已提上日程,屆時大家就可以進(jìn)行正常引用了。下一步,我們將進(jìn)行LorMe包可交互式APP的開發(fā),進(jìn)一步提升微生物組數(shù)據(jù)分析的便利性。這里我們先行展示一個整合本文兩個功能的即時交互式APP的demo:
以上就是LorMe包內(nèi)置的另外兩個獨(dú)立工具的使用方法。想要探索豐富的可視化模式、查看其他一鍵分析使用說明或了解APP開發(fā)進(jìn)度,請訪問: https://www./LorMe-aac2ba66a3bf46bd89c103e78550e6f4
|