18
2016.05
RNA-seq中GO、KEGG結果圖如何解讀
(gene ontology)資料庫,收集的是對各種物種基因功能進行限定和描述的標準詞彙(term),是國際標準化的基因功能描述分類系統。根據基因產物的相關生物學過程( biological_process)、細胞組成 (cellular_component)以及分子功能(molecular_function)三個大類分別給予定義,而每一大類下又包含更多層級具體term,這些定義與具體物種無關。
(Kyoto Encyclopedia of Genes and Genomes)是一個綜合資料庫,整合了基因體資訊、化學資訊和生化系統功能資訊,目前包含了16個子資料庫。比如,KEGG PATHWAY資料庫包含了圖解的細胞代謝、膜轉運、訊號傳導等路徑信息; KEGG GENES資料庫、KEGG GENOME資料庫則包含了部分或者完整序列的基因/基因體資訊;KEGG Orthology(KO)是KEGG直系同源資料庫,將各個KEGG註釋系統聯繫在一起,將分子網路和基因體資訊連結起來,根據直系同源關係,實現跨物種的基因體或轉錄體的功能註釋。
- 橫座標:GO三個基本分類(Biological Process、Cellular Component、Molecular Function)以及各類的下一層級term,從中可以看到描述 BP、CC或MF的具體term有哪些。透過該圖對應的表格可以查找某一個基因的具體功能資訊。
- 縱座標:
2. RNA-seq中,對差異表現基因進行GO富集分析,採用topGO實現有向無環圖,展示差異基因富集的GO term及其層級關係,從上至下所定義的功能範圍越來越具體。
3. 對BP、CC、MF三大類各取富集程度最高的前10位作為DAG圖主節點(方框表示),通過包含關係(is_a和part_of)將相關聯的GO term一起展示,顏色越深代表富集程度越高,可以看出某一個term可以有多個箭頭指向。比如biological process term "hexose biosynthesis" 有兩個parents:"hexose metabolism"和"monosaccharide biosynthesis",這是因為生物合成是代謝的一種,而己糖又是單醣的一種。
4. 每一個節點(方框or橢圓),包含4行資訊:GO term的id、該term的描述、GO富集的Corrected P-Value、該term下差異基因的數量/該term下基因體基因數的背景值。
KEGG 通路圖
這樣你有清楚知道GO跟KEGG如何解讀了嗎?希望能對研究中水深火熱的你帶來一點點的幫助~