03
2019.12
多重關聯分析 HAllA
原創文章 引用請註明出處
熱圖(Heatmap)是多體學關聯分析常見的呈現方式,目的是將不同體學觀察值的相關性透過熱圖呈現,顏色與統計說明體學資料間的關聯程度。常見也有將「微生物統計顯著數值」和「微生物相對豐度」與熱圖整合呈現,如下圖。
HAllA (Hierarchical All-against-All association) 是一個針對多維度、異質型資料的多重關聯分析工具[1]。HAllA 可用於連續型/分類型數值資料,且在同質型(homogeneous)資料(所有數值皆相同類型,例如:RNA-seq 基因表現)與異質型(heterogeneous)資料(不同單位或類型的數值,例如:病患臨床指標)皆可高效分析。在目前微生物研究中,HAllA是一個常用於微生物體-代謝體、微生物體-臨床指標 [2, 3]、微生物體-轉錄體(基因表現、miRNA、GO)[4, 5] 等關聯分析的重要工具。
HAllA 分析一般使用 Spearman's rank correlation 作為連續性數值資料(線性關係)的相似性評估方式,若為混合型數值結構(分類、連續性、二元數值資料),則採用標準化互資訊(Normalized Mutual Information, NMI) [6] 來比較特徵。降維階層分群則預設採用適用於各種數值資料類型的 medoid(例如PCA僅適用於連續性資料),並且可比其他降維方法保存更多原始資訊。
分析結果會有不同體學 feature-feature 與 cluster-cluster 間的相關性表與統計數值表。HAllA 關聯熱圖如下:
參考文獻
[1] Gholamali Rahnavard, E.A.F., Lauren J. McIver, Emma Schwager, Jason Lloyd-Price, George Weingart, Yo Sup Moon, Xochitl C. Morgan, Levi Waldron, Curtis Huttenhower, HAllA: Hierarchical All-against-All significance testing. http://huttenhower.sph.harvard.edu/halla. 2017.
[2] Yilmaz, B., et al., Microbial network disturbances in relapsing refractory Crohn's disease. Nat Med, 2019. 25(2): p. 323-336.
[3] Dimitriu, P.A., et al., New Insights into the Intrinsic and Extrinsic Factors That Shape the Human Skin Microbiome. MBio, 2019. 10(4).
[4] Viennois, E., et al., Host-derived fecal microRNAs can indicate gut microbiota healthiness and ability to induce inflammation. Theranostics, 2019. 9(15): p. 4542-4557.
[5] Lavelle, A., et al., Baseline microbiota composition modulates antibiotic-mediated effects on the gut microbiota and host. Microbiome, 2019. 7(1): p. 111.
[6] https://en.wikipedia.org/wiki/Mutual_information#Normalized_variants.
郭育倫 文案