05
2021.11
【RNAseq 3小學堂】基因富集分析_KEGG、GO、DO
原創文章 引用請註明出處
#RNAseq #富集 #雲平台 #3小學堂
|| 3分鐘速解RNAseq分析,本周介紹基因富集分析 ||
具有研究熱忱又認真的你開始整理所有找到的差異基因註釋,看看這些基因都是跟那些功能相關以及可能參與生化途徑,終於完成了精美的統計表格,老闆微笑看著你說,改變看看DEG篩選門檻吧!或許可以找到更多(少)基因...。
你心情down到谷底,只好上網搜尋更有效率的搜尋方法,此時你搜尋到了這個部落格,你發現......
|| 圖爾思雲平台可隨意改變DEG門檻,且能自動匯入各資料庫資訊,更能自動繪圖 ||
終於找到可以快速解決的方法,得到了不同DEG篩選結果。
但要怎麼知道這些DEG分析完的差異基因在各資料庫的pathway或分類中占有重要的一環,就不得不提到何謂”富集”。
|| 富集不僅僅是依照資料庫把差異基因分類,同時會依據資料庫與分析得到的基因數量比例進行統計 ||
我們總不能說在pathway A共有100個基因,我有10個差異基因都在這個pathway內,代表這個pathway對我的研究一定很重要!修但幾勒!
若有另一個pathway B共30個基因,你有10個差異基因在這個pathway,那究竟是pathway A還是B比較重要呢?
這就是富集分析的重要性,使我們客觀的評估研究結果。
若有另一個pathway B共30個基因,你有10個差異基因在這個pathway,那究竟是pathway A還是B比較重要呢?
這就是富集分析的重要性,使我們客觀的評估研究結果。
當所得到的p.adjust值越小表示富集程度越高,分析得到的差異基因對該基因群有特別的註釋傾向。
根據富集的結果可以畫出下列幾種圖表觀察,圖的部份將以 GO 為例做說明
長條圖
長條圖相信大家不陌生,也是廣為應用於富集類別/路徑的方式,可將類別/路徑依照想呈現的基因數量搭配p.adjust呈現。
點圖
與長條圖類似,增加了圓點的大小來呈現差異基因數量,呈現 p.adjust 前10顯著的類別/路徑。X軸為 Gene ration,Y軸為類別,圓點為該富集類別的差異基因數,圓點顏色表示p.adjust大小。
網絡圖
-
Enrichment Map: 針對富集類別,找出類別與類別間是否有重複的差異基因,並用連線來展示是否有重複,進而得到下圖的網路連線圖。圖上共呈現前15個富集類別。
-
Gene-Concept Network: 前面所敘述的幾種圖,都僅顯示重要的富集類別,想知道哪些差異基因參與在富集類別內,且又要同時展示基因是否重複,那就可以參考Gene-Concept Network。圖上同時用顏色呈現基因Fold change以及圓點大小呈現富集類別所含的差異基因數量。
由於富集類別有可能>10多個以上,若全繪製於圖上會難以辨識,因此在GO的結果中僅呈現Top 3富集類別,DO僅呈現Top 5富集類別。
網絡圖可以觀察到富集類別之間的連結,但我想快速知道這些富集類別交集的基因數有多少,有沒有其他呈現的方法?
|| Upset plot幫助你輕鬆判讀交集 ||
Upset plot
交集判讀,大家最熟知的非Venn圖莫屬,但當Venn圖上出現了3個以上的類別圈圈就會越看越模糊,Upset plots能夠解決這個問題,清楚呈現多樣本的交集情況。
Upset plot的判讀方式可以先參考下圖的基本解說。
Upset plot的判讀方式可以先參考下圖的基本解說。
下圖為以GO為例,為大家呈現upsetplot結果
貼心小提醒,上述大多數的圖都可以在雲平台上調整字型、大小等自由調控的功能喔!
差異表現量基因是單個在處理組和對照組表現有很大差異的基因,如果你的研究是很多基因微小變化造成的差異,很有可能在 DEG 系列的分析得不到好的結果,要知道每個分析都有其優缺點,不要氣餒,你可以試試看 GSEA 分析!
下回!小編將跟你分享GSEA的基本概念與分析結果!
圖爾思生物科技/微生物體研究中心
沈筱凌/顏維萱