07
2019.03
Tax4fun 菌群功能預測
原創文章 引用請註明出處
Tax4fun是一個以R 語言開發的基因功能預測套件,能依據 16S 數據進行菌群功能預測。與 PICRUSt 同是基於 marker gene 進行總體基因體功能預測的工具。相較 PICRUSt 推斷序列共同祖先後預測基因功能,Tax4fun 是基於透過 KEGG 原核基因體註釋資訊的序列直接地進行基因功能預測。Tax4Fun 使用 SILVA(Release 123) 作為資料庫來源,並基於此資料庫標記的 OTU 物種豐度進行功能預測。與PICRUSt 使用的 GreenGenes 資料庫相比,SILVA 資料庫的更新週期更為穩定且頻繁。
分析流程首先將基於 SILVA 的 16S rRNA 資訊,依據事前計算的關聯式矩陣線性轉換成 KEGG 原核生物的注釋資訊。接著,透過從 NCBI 基因體註釋獲得的 16S rRNA 拷貝數來標準化 KEGG 測量的生物豐度。最後,將歸一化的分類單元豐度線性組合於預先計算的 KEGG 生物的功能圖譜,以預測微生物群落的基因功能。
圖1. Tax4fun KEGG功能預測NMDS分析圖
Tax4fun分析輸出結果包含:KEGG ORTHOLOGY 第四層每個代謝路徑圖的注釋資訊;KEGG PATHWAY 資料庫六大類生物代謝路徑中,屬於代謝 (Metabolism)類別的第三層代謝路徑圖的資訊。此外,Tax4fun 提供了 FTU (Fraction Taxonomic units Unexplained)數值,其代表序列與分類單元關聯性矩陣中未能成功與 KEGG 資料庫注釋資訊產生對應關係的序列比例。
圖2. 組間統計顯著基因功能豐度柱狀圖
參考文獻
P. Aßhauer, B.W., R. Daniel, P. Meinicke, Tax4Fun: predicting functional profiles from metagenomic 16S rRNA data. Bioinformatics, 2015. 31(17): p. 2882-2884.
圖爾思生物科技 / 微生物體研究中心
郭育倫 文案
© BIOTOOLS. All Rights Reserved