03
2021.12
【RNAseq 3小學堂】WGCNA性狀關聯分析
原創文章 引用請註明出處
#RNAseq #WGCNA #雲平台 #3小學堂
|| 3分鐘速解RNAseq分析,本周介紹WGCNA性狀關聯分析 ||
上篇介紹了 WGCNA 的基本概念,你非常有興趣並興致勃勃的準備了15 個以上的樣品,卻發現報告中 WGCNA 分析的結果比別人還少,這是怎麼一回事?
上篇介紹了 WGCNA 的基本概念,你非常有興趣並興致勃勃的準備了15 個以上的樣品,卻發現報告中 WGCNA 分析的結果比別人還少,這是怎麼一回事?
小編說,本篇介紹的 WGCNA 分析內容只會在有性狀資料的時候才會提供呀~如果沒辦法提供性狀的話就只能略過囉~
不過,也不是所有的性狀都可以用來分析,性狀的填寫需要注意以下幾點:
1. 必須為連續性狀數值(e.g. 年齡、體重、株高等),不能進行類別性狀分析 (e.g. 性別等 )
2. 不能有任何缺值
3. 性狀資料內容僅能接受數字
WGCNA 分析與其他分析的不同之處在於可以結合性狀數值進行分析,還記得
模塊(Module)與特徵基因(Eigengene)嗎 ? 性狀關聯分析便是觀察性狀、模塊的特徵基因和模塊的所有基因三者的關係,來尋找可能與性狀表現有關的基因。
以下圖為例,在熱圖上可以觀察所有性狀和模塊Eigengene的關聯性,比如說 性狀BMI 跟 tan以及darkturquoise模塊就有較高的相關性,可以嘗試從這兩個模塊研究關於性狀BMI 的基因。
此外,也可以觀察特定性狀與不同模塊中每個基因的關聯性,此數值被稱為 GS (Gene significance),從 boxplot 可以看到每個模塊 GS 的分布,觀察到 性狀BMI與 tan 以及darkturquoise 模塊的GS 也較其他模塊高,與前面的 eigengene 與性狀的結論相似。
接著,set_MM_GS 的分布也可以觀察模塊中的基因、性狀與特徵基因的關係,下圖中一個點代表模塊中的一個基因,Module membership (MM)表示基因與特徵基因的相關性, GS 表示基因與性狀的相關性,將 MM 與 GS 取絕對值後繪製散布圖,散布圖越接近斜直線的模塊,表示整體模塊越有可能參與目標性狀的調控。
而在圖片右上方的基因,表現趨勢和模塊特徵基因高度相關且同時與性狀相關性高,較有機會成為調控性狀基因的候選。
而在圖片右上方的基因,表現趨勢和模塊特徵基因高度相關且同時與性狀相關性高,較有機會成為調控性狀基因的候選。
這兩個月 RNA 三小學堂分享了許多 RNAseq 分析項目,是不是對於各種表格跟 read count 標準化方法眼花撩亂了呢?
下一回,小編整理常見的幾種 read count 標準化方法(FPKM、TPM、RLE/TMM),幫助大家更清楚的了解其中的差異喔~
圖爾思生物科技/微生物體研究中心
顏維萱/沈筱凌
顏維萱/沈筱凌