26
2021.11
【RNAseq 3小學堂】WGCNA: Weighted Correlation Network Analysis
原創文章 引用請註明出處
#RNAseq #WGCNA #雲平台 #3小學堂
|| 3分鐘速解RNAseq分析,本周介紹WGCNA ||
由於在區分模塊的過程並不會參考資料庫的註釋,有可能可以發現一些新的基因調控機制或是關聯。
一般來說同一個模塊內的基因表現模式相似,可能具有潛在的相似功能,此時可以根據已知基因功能推測未知基因功能,或是基於基因間的連接性篩選關鍵基因。
WGCNA 會把數萬個基因依照表現趨勢分為數個或數十個不同的模塊(module),同個模塊中的基因會被認為有類似的功能或是有相關性,同時每個模塊會計算一個虛擬的特徵基因 (eigengene) 來代表模塊中的所有基因表現。
看到這裡你可能想:怎麼每個字分開我懂,組在一起就不知道什麼意思了?
下圖以圖像化簡單的解析一下 WGCNA 的概念:
從下圖層次聚類分析(hierarchical clustering)圖可以看到,表現相似、被聚類在一起的基因通常會屬於相同的模塊,不同的模塊會以顏色命名,模塊的顏色和順序並沒有特別涵義(無法被分類的基因會歸為 gray),僅作為不同模塊的標記。
簡單來說,1 個 eigengene 數值可以最大程度的代表模塊中數百甚至數千個基因的表現,以圖片為例,原本上萬個基因表現量被壓縮成 9 個 eigengene,在處理效應顯著與組內重複一致的狀況下,可以觀察到使用這些 eigengene 進行樣品聚類,可以很好的將處理組合分開,組內重複的 eigengene 值也有類似的趨勢。
也就是說某些模塊可能對於樣品處理間的差異有很大的貢獻,這就可能是我們的目標模塊。
也就是說某些模塊可能對於樣品處理間的差異有很大的貢獻,這就可能是我們的目標模塊。
在 WGCNA 分析中,樣品越多可以得到越穩定的結果,除了觀察模塊與樣品之間的關係之外,也可以觀察模塊與模塊間的相關性,模塊之間可能有偕同表現或拮抗的情形,也有機會從中挑選有興趣的模塊。
有了目標模塊之後,就可以進一步的去觀察模塊內部以及模塊間基因的關係,下圖便是藍色模塊與咖啡色模塊的基因 network,可以互動觀察基因間的關係。
由於在區分模塊的過程並不會參考資料庫的註釋,有可能可以發現一些新的基因調控機制或是關聯。
一般來說同一個模塊內的基因表現模式相似,可能具有潛在的相似功能,此時可以根據已知基因功能推測未知基因功能,或是基於基因間的連接性篩選關鍵基因。
看到這裡你可能想,我可以在模塊中搜尋一些相關基因,但似乎還沒有看到 WGCNA 在相對於實驗分組兩兩比較的優勢?
因為 WGCNA 分析具有在不考慮分組等實驗條件下,可直接觀察樣品特性與基因表現的相關性來確認可能與性狀調控有關的基因模塊。WGCNA 與性狀分析等說明,就待小編下一回介紹吧。
圖爾思生物科技/微生物體研究中心
顏維萱/沈筱凌
顏維萱/沈筱凌