17
2016.05
你看得懂這些分析圖嗎?-文氏圖、聚類熱圖、火山圖
定序完成後,接下來就是換生物資訊分析接棒了~ 在RNA-seq 項目中,常見的結果圖片包括:火山圖、文氏圖、聚類熱圖、log2(ratios)折線圖、有向無環圖、散點圖、代謝通路圖、蛋白質交互作用圖等。但是,經由生資高手所產生的圖片,若第一次接觸想必會有種我看過你、但我不認識你OS產生吧!所以接下來就讓小編來解讀一下這些圖片所代表的意義吧~
火山圖
RNA-seq 中,火山圖 (Volcano Plot) 顯示了兩個重要指標:(1) Fold-Change (2) 校正後得 p value,利用 t-test 分析出兩樣本間顯著差異表現的基因後,以 log2(Fold-Change) 為橫座標,以 t-test 顯著性檢驗 p值的負對數 log10(padj) 為縱座標。
火山圖
RNA-seq 中,火山圖 (Volcano Plot) 顯示了兩個重要指標:(1) Fold-Change (2) 校正後得 p value,利用 t-test 分析出兩樣本間顯著差異表現的基因後,以 log2(Fold-Change) 為橫座標,以 t-test 顯著性檢驗 p值的負對數 log10(padj) 為縱座標。
圖示解釋: 紅色點表示TS樣本相對於對照樣本CK表現量上調的基因,綠色點表示下調的基因。縱座標,校正後的 p-value (padj) 越小,表示差異越顯著,對應的-log10(padj)數值越大。因此,左上角和右上角的點分別表示表現差異非常顯著的下調基因和上調基因。對於有生物學重複的樣本,要求padj < 0.05,因此上圖中紅色點和綠色點均在1.3以上。
名詞解釋:
(1) Fold-Change:變化倍數,標準化信號值之間的比值,這裡指的是不同樣本中 read count 值的比值。 (2) p value:t-test 用於判斷兩個平均數的差異是否顯著的值 (3) q value:經過多重校驗後的 p value,能更好地控制假陽性率 (false positive)。
文氏圖
文氏圖 (Venn Diagram) 用於顯示元素集合重疊區域的圖示,常用圓或橢圓表示。根據參與集合數,可將之分為二集合、三集合、四集合、五集合等。可利用R語言來繪製文氏圖,例如R語言中的Vennerable package。
文氏圖 (Venn Diagram) 用於顯示元素集合重疊區域的圖示,常用圓或橢圓表示。根據參與集合數,可將之分為二集合、三集合、四集合、五集合等。可利用R語言來繪製文氏圖,例如R語言中的Vennerable package。
圖示解釋:
在RNA-seq中,每個橢圓表示一個比較組合(處理組 vs. 對照組)中的差異基因,橢圓重疊區域的數字表示對應的多個比較組合之間的共有差異基因個數,未重疊表示各比較組合特有的差異基因。可以通過與 Venn diagram 對應的表格,看到比較組合共有和特有的基因信息。
聚類熱圖
熱圖通常用以特殊顏色的形式顯示訪客熱衷的頁面區域和訪客所在的地理區。當熱圖用在 RNA-seq中,可以表示圖中某一個位置的基因表現量的高低。聚類熱圖可用於判斷不同實驗條件下差異基因的表達模式。每個比較組合都會得到一個差異基因集,將所有組合的差異基因聯集在每個樣品的FPKM值用於『層次聚類、K-means聚類和SOM聚類分析』。熱圖可以藉由R語言工具中的pheatmap繪製。
圖示解釋:
聚類熱圖包括兩種資料的資訊,一種表示不同的實驗處理條件/樣本(如圖中橫軸),另一種表示不同的基因(如圖中縱軸),根據聚類分析可以將不同樣本中表現模式相同或相似的基因聚為一類。表現模式相似的基因可能具有相似的功能,共同參與同一代謝過程或存在於同一細胞通路中,因此,將表現模式相同或相近的基因聚集成類,可以用於推測未知基因的功能或已知基因的新功能。 紅色:表示基因表現高 ; 藍色:表示基因表現低。 聚類方式:雙向聚類(如上圖),可以根據某一基因在不同樣本中的表現將樣本聚類,同時可以根據某一樣本中不同基因的表現將基因進行聚類。另有橫向/縱向聚類、無向聚類。
折線圖
log2(ratios) 折線圖展示的是各個基因在不同樣本中表現量的變化趨勢(表達模式)。表達模式相近的基因被聚為一類,根據基因的表達模式差異,會形成多個subcluster。
聚類熱圖包括兩種資料的資訊,一種表示不同的實驗處理條件/樣本(如圖中橫軸),另一種表示不同的基因(如圖中縱軸),根據聚類分析可以將不同樣本中表現模式相同或相似的基因聚為一類。表現模式相似的基因可能具有相似的功能,共同參與同一代謝過程或存在於同一細胞通路中,因此,將表現模式相同或相近的基因聚集成類,可以用於推測未知基因的功能或已知基因的新功能。 紅色:表示基因表現高 ; 藍色:表示基因表現低。 聚類方式:雙向聚類(如上圖),可以根據某一基因在不同樣本中的表現將樣本聚類,同時可以根據某一樣本中不同基因的表現將基因進行聚類。另有橫向/縱向聚類、無向聚類。
折線圖
log2(ratios) 折線圖展示的是各個基因在不同樣本中表現量的變化趨勢(表達模式)。表達模式相近的基因被聚為一類,根據基因的表達模式差異,會形成多個subcluster。
圖示解釋:
灰色線表示一個cluster中的基因在不同實驗條件下相對表現量(聚為一類的基因會有很多個,圖中顯示會比較密集)。藍色線表示這個cluster中所有基因在不同實驗條件下相對表現量的平均值。 x軸表示實驗條件,y軸表示相對表現量。