BIOTOOLS檔案_全基因體組裝,成功關鍵都在這!
▌案件大綱
- 品項: Whole Genome Sequencing / Iso-Seq
- 定序平台: PacBio Sequel IIe
- 樣品物種/類型: 昆蟲 DNA / RNA
- 欲解決案件難題: 客戶希望進行昆蟲基因體的發表,因此委託圖爾思進行三代定序和分析,但是在樣品製備步驟就卡關,準備的樣品一直無法通過品質檢驗。
- 解方: 經仔細盤查樣品製備流程,給予有效的改善建議,並根據實驗情況設計定序流程,最終取得連續性與完整度都很棒 (超出預期) 的組裝基因體。
▌案件詳述
動植物全基因體定序,可應用於疾病模型研究、基因體功能分析、物種保存策略、演化關係探討、特定環境適應研究,以及動植物育種等領域當中。這些研究主題都有一個共通點,就是需要一個準確、可信賴的參考基因體。隨著三代定序成本逐年下降,搭配強大的長讀長優勢,越來越多科學家將它視為組裝基因體的標準配備,並投身參考基因體的發表行列。在您也被三代定序的強大威力所擄獲時,您是否曾經想過:
我也想用三代定序進行全基因體定序,我應該怎麼準備樣品呢?
本次案件分享的客戶,對於昆蟲個體間的表型差異深感興趣,但是該物種沒有已知的參考基因體,鄰近物種的參考序列也不適用,因此希望先發表組裝基因體,作為後續研究重要的參考依據。
由於客戶樣品稀有不易準備,加上單一蟲體能萃取的DNA總量有限,經過討論決定使用PacBio 低 DNA 總量建庫流程 (HiFi Library from Low DNA Input) 進行實驗。然而客戶準備的 DNA 純度,卻無法順利通過樣品檢測的門檻。圖爾思三代定序領域應用科學家 (FAS) 與客戶討論核酸製備流程,發現魔鬼藏在細節裡,造成核酸純度不佳的原因,竟然在實驗最後一步。為了提高核酸回收總量的添加物,在此時此刻卻拖累了核酸品質。除此之外,FAS 注意到採樣方式也需要修正,建議客戶調整取樣方式,以降低影響核酸品質的因素。
客戶採納建議重新萃取的核酸,順利通過檢測門檻,並取得高品質的定序結果,有超過一半的數據準確度達到 QV40,並且 HiFi reads 平均長度超過 10 kb。於是進行從頭組裝 (de novo assembly) 分析,圖爾思使用兩種不同組裝工具測試,根據結果判斷本次定序深度不足,造成組裝的 contig N50 未達到令人滿意的水準。
由於客戶希望組裝基因體的連續性,至少 contig N50 要超過 1 Mb。在提供客戶測試結果,和詳細的報告解說後,建議增加定序深度以提升組裝基因體的連續性,並且推薦使用重新製備的 DNA 建庫樣品再次定序,而不使用剩餘的 DNA 建庫樣品進行加測,這個方法是為了增加序列組成的多樣性,避免數據集中在特定基因體區域。重新定序的 HiFi reads 平均長度接近 10 kb,並且過半的數據準確度達到 QV42,依舊展現高品質的定序結果。
接著進行兩次數據的合併組裝,contig N50 上升到 14.5 Mb,顯示基因體連續性有飛躍性的進步,BUSCO 判斷基因體完整性達到 98.6%,定序深度超過 30 倍。
因為基因體組裝結果超乎期待,客戶後續也委託圖爾思進行Iso-Seq實驗,希望用於組裝基因體註釋。由於真核生物的基因包含內含子 (intron),不易精確預測基因位置,使用轉錄本序列進行註釋是常用的策略,尤其是 PacBio 推出的 Iso-Seq 全長轉錄體定序,提供的數據能更精確的註釋基因位置,也能用於 RNA 選擇式剪切 (alternative splicing) 的研究。本次案件完成的昆蟲 Iso-Seq 定序,產出超過 4 M HiFi reads,其中超過一半的數據準確度達到 QV41,高達 98% 的數據能比對到組裝基因體,再次展現圖爾思高品質的定序結果。
最終基因體註釋分析順利完成,FAS 也提供詳細的報告解說,和後續所有的疑問回覆。
您也有樣本想進行基因體發表嗎? 是否樣本準備上遇到困難? 或是因為不熟悉技術而猶豫不前? 快聯繫圖爾思,了解更多三代定序的解決方案。
點擊了解更多WGS品項
點擊了解更多Iso-Seq品項
ngs@toolsbiotech.com
(02)26972697
圖爾思生物科技 / 微生物體研究中心
卓濬哲 文案
http://www.toolsbiotech.com/
© BIOTOOLS. All Rights Reserved