© 2021 BIOTOOLS Co., Ltd. All Rights Reserved

latest news

最新消息

14 2021.04

讀完這篇,即刻獲得Iso-Seq高手-高手-高高手尊稱!!

     原創文章     引用請註明出處

雖然小編知道我們聰明的讀者早八百年前就知道Iso-Seq是什麼了(不知道的也要趕快點頭喔),但是,還是邀請各位一起讀完這篇關於Iso-Seq的完整介紹喔!
話不囉嗦,我們直接破題!
所謂Iso-Seq就是 isoform sequencing,也就是同源異構體定序,是RNA sequencing的一種。Iso-Seq是由目前三代定序龍頭Pacific Biosciences(以下簡稱PacBio)所提供之全長轉錄本定序之技術。

在真核組織中,大多數gene是可剪接的,選擇性剪接是人類基因體增加複雜度的一項重要分子機制,能夠從單一模板產生多種transcript isoforms,大大增加了基因體蛋白編碼的多樣性。同一個gene產生的可變剪接是大大的不同的,有時甚至會起到相反的效應。

關於目前科學家進行轉錄體定序之方法,在2013年Ian Korf博士曾於《Nature Methods》期刊中將轉錄體比喻為一本雜誌,由於主流進行RNA-Seq的方法是使用短讀長的平台進行定序,所以需要使用超音波或酵素的方法將cDNA打斷後再進行定序(如同Fig.1右上圖使用碎紙機將期刊碾碎),再使用大量的生物資訊軟體(Fig.1左下的大量人力)進行拼裝及預測可能的轉錄體內容,但是由於技術限制最後還是無法得到最原始的資訊結果。
Fig1_20210413163133942.png
(Fig. 1)

其實沒有相關背景的人以直覺去看Fig.1《Nature Methods》中我們目前研究轉錄體的方法一定會覺得我們NGS界的科學家在想什麼XD…,所幸,三代定序提供了我們直接觀測全長轉錄本的另一個選擇: Iso-Seq。以往使用NGS的方法進行轉錄本的預測(Fig.2),我們僅能依靠少數有跨越過splice junction的短讀長reads才能發現不同的exon間有選擇性剪接產生的接點,但是僅僅依靠兩個exon間的接點資訊,我們依然很難預測出成千上萬個mRNA isoform的全貌,而且使用演算法進行isoform的預測終究有其限制,尤其是在匯入資訊不足的情況下,容易有誤判的結果產出。而PacBio平台定序利用SMRT定序技術直接生成高準確度(>99.9%)長讀長的HiFi reads,直接對反轉錄的全長cDNA定序,可提供從5'端到3’端polyA tail、跨越整個轉錄本異構體的序列。Iso-Seq方法可提供選擇性剪接exon和轉錄起始位點的準確信息。對於長達10 kb的轉錄本,還可提供polyA位點的訊息,能夠涵蓋目標基因或整個轉錄體的全長異構體,能夠不需要任何的組裝直接進行全長轉錄本定序。
Fig2.png
(Fig. 2)

目前Iso-Seq的建庫方法有三種:
1. 同一個樣品的全長轉錄體,不需要接barcode區分樣品
2. 混樣不同樣品的全長轉錄體,需要接上不同barcode,接上barcode後可以一起進行建庫及定序
3. 針對有興趣的部分基因進行全長轉錄體的定序 提供使用者可以依照不同的需求進行實驗設計,以達最高C/P值。
Fig3.png (Fig. 3)

而Iso-Seq的分析有兩個模式可供選擇: 從頭開始(de novo)或具參考序列的模式。 分析包括三個主要步驟:(Fig.4)
1. Classify:將base calling完成的data去除cDNA primer序列及poly-A,然後將得到的read分為全長、非全長、嵌合型及非嵌合型。
2. Cluster:利用反覆運算Cluster和錯誤糾正(ICE)演算法,根據分類的reads預測新發現轉錄本的一致性isoform。
3. Map:利用GMAP,將分類的reads和預測的一致性isoform與指定的參考序列進行比對。
Fig4.png
(Fig. 4)

最後根據分析結果,將得到的Isoform分為四大類: (Fig. 5)
i. FSM= Full Splice Match, matches reference perfectly
ii. ISM = Incomplete Splice Matches, matches reference partially
iii. NIC = Novel In Catalog, novel isoform using known junctions
iv. NNC = Novel Not in Catalog, novel isoforms using novel junction
Fig5.png
(Fig.5)

時至今日,已經有上百篇文獻使用Iso-Seq更新了研究目標的轉錄本上限,他們都呈現了一個共同的結果—即使是已經獲得了豐富轉錄本鑑定結果的組織細胞,在加入了Iso-Seq技術後發現了比以往的觀察更為豐富的轉錄本多樣性。由此結果可以很明確的推論,這是由於過去NGS短讀長技術導致無法具體而直接的呈現轉錄本isoform的多樣性而造成的錯漏。

最後,我們來講講Iso-Seq除了看選擇性剪接(alternative splicing)還能幫我們看什麼呢? 這邊,我們給你一些提示,Iso-Seq同時還可以看polyA tail motif與特定的轉錄本亞型的關聯性、基因體的註釋、Fusion gene expression transcript、等位基因的Phasing表達鑑定、以及長鏈非編碼RNA (lncRNA)…等,都是很好利用Iso-Seq技術獲得完整解答的應用。 然後,最後的最後,謝謝大家花時間看完這篇文章,小編下台一鞠躬~


參考資料

1.Ian Korf(2013) Genomics: the state of the art in RNA-seq analysis.Nature Methods, Nov 26;10(12):1165-6, Doi:10.1038/nmeth.2735 (Fig. 1)
2.Pacific Biosciences of California, Inc (Fig. 2~5)
圖爾思生物科技 / 微生物體研究中心
吳雁韻 文案
 
回上一頁
標籤
三代定序
聯絡我們
CONTACT US
立即前往

抱歉,為了您的瀏覽體驗及安全性,本網站不支援IE瀏覽器,請參考下方常用瀏覽器。