30
2019.10
ANCOM 微生物組間差異物種分析
原創文章 引用請註明出處
微生物體資料分析通常為了考慮定序深度的差異,豐度會標準化為比例關係(例如,相對豐度)。而這樣的組成型資料常造成統計上的偏差,為了能改善其統計效力也發展出相應的分析方法。在進行相對豐度於組間的差異分析中,除了採用累計求合標準化(cumulative-sum scaling, CSS)方法的 metagenomeSeq[1] 外,目前QIIME2也提供另一個能檢測組間微生物群落中具有顯著性差異物種的分析方法 – ANCOM (Analysis of composition of microbiomes)[2]。
ANCOM 作者 Dr. Siddhartha Mandal 提出了基於成分對數比(compositional log-rations, CLR)進行資料轉換的方式,能有效消除運用相對豐度等組成型資料所帶來的偏差。而 ANCOM 的結果使用 W 統計量來衡量物種於組間的差異是否顯著,代表推翻物種於組間沒有差異的假設檢定的累計次數,數值越高(最大值為 Feature 總數減一)表物種在組間的差異顯著性越高,但W值無法在不同 Feature 表做相互比較。ANCOM 兩組間的統計藉由 Wilcoxon rank-sum test ; 多組間則藉由 ANOVA,並採用 Benjamini-Hochberg procedure 校正 p-value。分析預設以單一 Feature 在所有樣品中為 0 比例小於 0.9 作為過濾資料的標準,設定統計顯著差異門檻 p-value < 0.05。
ANCOM 作者 Dr. Siddhartha Mandal 提出了基於成分對數比(compositional log-rations, CLR)進行資料轉換的方式,能有效消除運用相對豐度等組成型資料所帶來的偏差。而 ANCOM 的結果使用 W 統計量來衡量物種於組間的差異是否顯著,代表推翻物種於組間沒有差異的假設檢定的累計次數,數值越高(最大值為 Feature 總數減一)表物種在組間的差異顯著性越高,但W值無法在不同 Feature 表做相互比較。ANCOM 兩組間的統計藉由 Wilcoxon rank-sum test ; 多組間則藉由 ANOVA,並採用 Benjamini-Hochberg procedure 校正 p-value。分析預設以單一 Feature 在所有樣品中為 0 比例小於 0.9 作為過濾資料的標準,設定統計顯著差異門檻 p-value < 0.05。
ANCOM 豐度差異火山圖
ANCOM 雖為優異的組間差異顯著物種分析工具,但當使用資料數據有以下特性時將影響分析結果的可信度:(1) 分析結果中有大量的 Features 具有顯著差異;(2) 豐度表中大量的 Features 為 0。
ANCOM 分析結果
微生物領域已有許多如metastats、metagenomeSeq、LEfSe等知名物種顯著性分析工具,但若能搭配更多不同資料轉換與統計模型,應能協助科學家們從茫茫菌海中找到一絲重要的蛛絲馬跡,未來小編會繼續關注最新的生物資訊方法與統計工具並分享給大家。
參考文獻
[1] JN Paulson MP, H.B., metagenomeSeq: Statistical analysis for sparse high-throughput sequencing. Bioconductor package: 1.11.10 ed, 2013.
[2] Mandal, S., Van Treuren, W., White, R. A., Eggesbo, M., Knight, R., and Peddada, S. D. (2015). Analysis of composition of microbiomes: a novel method for studying microbial composition. Microb. Ecol. Health. Dis. 26:27663.
圖爾思生物科技 / 微生物體研究中心
張美虹 文案
© BIOTOOLS. All Rights Reserved