10
2022.08
起步~走! 三代定序邁向臨床應用
原創文章 引用請註明出處
ㄅㄨ~ㄅㄨ~三代定序的讀長無限列車開往臨床應用領域囉~ 搭乘旅客注意: 列車上禁止進食便當,以免跟炎柱大哥一樣開打前吃太多便當就......領了便當
(圖/翻攝自Muse木棉花-TW YouTube)
在過去的幾年裡,三代定序平台如 PacBio 和 Oxford Nanopore Technologies (ONT) 的單分子定序平台,已經協助眾多科學家在學術研究上取得巨大進步,那麼,在臨床應用的領域上又是如何呢?
其實現在在遺傳諮詢師/臨床醫生 v.s 生物資訊學專家/定序專家之間仍然存在著不小的知識溝通的鴻溝,因而阻礙了臨床上的應用。在許多情況下,臨床醫生並不瞭解三代定序技術提供的新可能性,同理,定序專家也並不總是瞭解醫療保健系統的需求。本篇文章希望能幫助彌補兩者之間的鴻溝,讓目前臨床上懸而未決的議題可以找到合適的解決方法。
與短讀長 NGS 和 Sanger 定序相比,三代定序具有幾個重要的優勢: 長讀長、高一致性準確度、直接辨識鹼基修飾、RNA 直接定序和攜帶便利等特性,
能夠跨越 NGS 平台無法覆蓋或直接定序等難以分析的基因體區域; 包含引起疾病的長重複序列、極端 GC 含量區域和複雜的基因位點。此外,三代定序能夠以高專一性及高靈敏度發現結構變異,並直接檢測天然 DNA 中的表觀遺傳標記。不僅如此,三代定序簡單的建庫流程和即時定序可以加快檢測的周轉時間,後續的工作流程也持續在進行簡化和驗證,適合將其應用到臨床常規檢測當中。
三代定序正在徹底改變臨床試驗,例如直接定序 FMR1 等位基因以測定其長度和檢測重複序列中 AGG 中斷序列的發生、以超高解析度進行 HLA 分型、解開 chromothripsis 基因體、低突變率的癌症基因(如 TP53 和BCR‑ABL1)的檢測,並可進行即時基因檢測等。
下面將會統整三代定序在臨床應用的不同領域上的進展,我們一起來看看三代定序目前在臨床上解決了那些議題,又可以適用在哪些相似的議題吧!
重複序列與複雜疾病位點定序
高度同源性區域通常具有超過 NGS 讀長大小的相同序列片段,代表著即使基因體中只有兩個拷貝,也很難正確定位序列和定相等位基因,就像許多假基因一樣。
人類基因體中的致病性結構變異
基因體組裝:從病原微生物到人類
總結: 臨床常規檢測應用可能性
ㄅㄨ~ㄅㄨ~三代定序的讀長無限列車開往臨床應用領域囉~ 搭乘旅客注意: 列車上禁止進食便當,以免跟炎柱大哥一樣開打前吃太多便當就......領了便當
(圖/翻攝自Muse木棉花-TW YouTube)
在過去的幾年裡,三代定序平台如 PacBio 和 Oxford Nanopore Technologies (ONT) 的單分子定序平台,已經協助眾多科學家在學術研究上取得巨大進步,那麼,在臨床應用的領域上又是如何呢?
其實現在在遺傳諮詢師/臨床醫生 v.s 生物資訊學專家/定序專家之間仍然存在著不小的知識溝通的鴻溝,因而阻礙了臨床上的應用。在許多情況下,臨床醫生並不瞭解三代定序技術提供的新可能性,同理,定序專家也並不總是瞭解醫療保健系統的需求。本篇文章希望能幫助彌補兩者之間的鴻溝,讓目前臨床上懸而未決的議題可以找到合適的解決方法。
與短讀長 NGS 和 Sanger 定序相比,三代定序具有幾個重要的優勢: 長讀長、高一致性準確度、直接辨識鹼基修飾、RNA 直接定序和攜帶便利等特性,
能夠跨越 NGS 平台無法覆蓋或直接定序等難以分析的基因體區域; 包含引起疾病的長重複序列、極端 GC 含量區域和複雜的基因位點。此外,三代定序能夠以高專一性及高靈敏度發現結構變異,並直接檢測天然 DNA 中的表觀遺傳標記。不僅如此,三代定序簡單的建庫流程和即時定序可以加快檢測的周轉時間,後續的工作流程也持續在進行簡化和驗證,適合將其應用到臨床常規檢測當中。
三代定序正在徹底改變臨床試驗,例如直接定序 FMR1 等位基因以測定其長度和檢測重複序列中 AGG 中斷序列的發生、以超高解析度進行 HLA 分型、解開 chromothripsis 基因體、低突變率的癌症基因(如 TP53 和BCR‑ABL1)的檢測,並可進行即時基因檢測等。
下面將會統整三代定序在臨床應用的不同領域上的進展,我們一起來看看三代定序目前在臨床上解決了那些議題,又可以適用在哪些相似的議題吧!
重複序列與複雜疾病位點定序
- 人類基因體包含許多與個體健康相關的高複雜度和低複雜度區域。這些區域包含低複雜度的串聯重複序列、難以評估其相關致病基因的假基因、高度變異的基因複合物和高度拷貝數變異區,都是 NGS 的短版,卻是三代定序合適的應用。
串聯重複序列的變異可能導致許多疾病,包括神經系統疾病、神經退行性疾病或神經肌肉疾病:
- X染色體脆折症: 使用 PacBio 定序 FMR1 基因中 > 200個 CGG 重複序列,100% GC區域 [1] [2][3]。
- 體染色體顯性腎小管間質性腎病: 使用 PacBio 定序 MUC1 基因,60 bp VNTR 序列 [4]
- 第10 型脊髓小腦退化性動作協調障礙與帕金森症: 使用 PacBio 定序 ATXN10 基因,高度 ATTCT 重複序列 [5] [6]。
- 脊髓側索硬化症: 使用 CRISPR-Cas9 配合 PacBio 定序 C9orf72 基因,GGGGCC 重複序列,100% GC區域 [7]
- 亨丁頓舞蹈症: 使用 PacBio 定序 HTT 基因,CAG 重複序列 [8]
- 面肩胛肱肌肉萎縮症: 使用 ONT 定序 D4Z4重複序列陣列 [9]
高度同源性區域通常具有超過 NGS 讀長大小的相同序列片段,代表著即使基因體中只有兩個拷貝,也很難正確定位序列和定相等位基因,就像許多假基因一樣。
- 藥物代謝基因: 使用 PacBio 定序 CYP2D6 基因與假基因 CYP2D7 [10] [11]
- 色素失禁症: 使用 PacBio 定序免疫遺傳疾病 IKBKG 基因與假基因 IKBKGP1 [12]
- 多囊腎病 (ADPKD): 使用 PacBio 定序 PKD1 基因與六個假基因 [13]
- 高雪氏症: 使用 ONT 定序 GBA 基因與假基因 GBAP [14]
- HLA 分型: 使用 PacBio 定序 HLA 基因以提高解析度 [15] [16]
- 殺手細胞免疫球蛋白受體 (KIR) 區域: 使用 PacBio 定序高度同源的 KIR 基因 [17]
- 人類Y染色體: 使用 ONT 定序人類 Y 染色體包含具高度串聯重複序列的著絲點 [18]
人類基因體中的致病性結構變異
- 由於結構變異的複雜性和多樣性,使用 NGS 找出基因體定序數據中的結構變異其實並不容易,先前研究指出使用多項長讀長定序技術進行結構變異檢測比單獨使用高深度 NGS 定序所發現的結構變異數增加了7倍 [19],此外三代定序還提供了單倍型的資訊。
- 體染色體顯性 Carney 綜合症: 使用 PacBio 定序為患者找出 PRKAR1A 基因上 2,184bp 的缺失 [20]
- Bardet-Biedl 綜合症 (BBS): 使用 PacBio 定序確認了 BBS9 同型合子缺失的精確斷點 [21]
- 性聯遺傳肌張力障礙帕金森症候群: 文獻指出使用 PacBio 和 10x Chromium 基因體和轉錄體定序是確定該疾病遺傳原因的關鍵,提供了單倍型資訊並檢測 SINE‑ VNTR‑Alu (SVA) 插入 [22]
- 貝克氏肌肉萎縮症: 使用 PacBio 定序對先前發現的引起疾病的遺傳變異進行基因分型 [23]
- 複雜結構變異發現: 使用 ONT 定序確定所有 de novo chromothripsis 斷點的親本起源並解決這些複雜重排的結構,其通常發生在腫瘤基因體和先天性疾病患者中。 [24]
- 乳腺癌: 使用 ONT 定序乳腺癌樣本獲得了更高專一性和靈敏度的全方位結構變異 [25]
- 乳腺癌: 使用 PacBio 定序 SK‑BR‑3 乳腺癌細胞系,檢測到誘導融合基因形成的 HER2 擴增子的複雜性和重排 [26]
- 腦腫瘤: 使用 ONT 定序在一天內對腦腫瘤進行診斷分類,結果勝過基於雜交的診斷方法 [27]
基因體組裝:從病原微生物到人類
- 三代定序技術已經將基因體的 De novo 組裝提升至全新的境界。完整組裝細菌基因體在幾年前仍是一項昂貴且耗時的任務,現在已成為大多數實驗室負擔得起的標準程序。由英國 Sanger 研究所和 NCTC發起的國家典型培養物收藏 (NCTC) 3000 計畫,現在正在利用三代定序來系統地組裝和公開數千種對全球健康具有重要意義的細菌和病毒的基因體。三代定序日漸增長的數據量也促進了在人類基因體上完成組裝的成就,已有越來越多的研究者使用三代定序來進行大型基因體的組裝。
- 真核病原體組裝: 使用 PacBio 定序一種每年殺死 30,000 多人的原生動物寄生蟲---利甚曼原蟲,作為真核病原體的新參考基因體 [28]
- 人類基因體組裝: 使用 PacBio 定序韓國人類基因體的從頭組裝和定相 [29]
- 人類基因體組裝: 使用 PacBio 定序中國人類基因體的從頭組裝[30]
- 多個基因體組裝: 使用 PacBio 定序建立真正的二倍體參考基因體,而非當前的單倍體版本[31]
- 人類基因體組裝: 使用 ONT 定序完整組裝 CHM13 人類端粒至端粒X染色體 [32]
總結: 臨床常規檢測應用可能性
- 三代定序與 NGS 和 Sanger 定序相比,其具有的優勢與簡單的建庫流程和即時定序都可以加快周轉時間。但是,為了適用到臨床常規檢測,仍然需要由基因體學和生物資訊學領域的專家提供符合國際標準化組織 (ISO) 標準和當地相關法規的檢測流程,在數據處理上也需要進行標準化並開發自動化的二級分析工具,再加上可以根據分析結果指導患者適當治療的解釋。
- 如今,三代定序 PacBio 和 ONT 提供的平台,正在徹底改變 DNA 定序在醫學上的應用範圍。三代定序提供了直接觀察許多困難區域甚至是以前無法定序的基因體區域的能力,包含重複序列、結構變異斷點、假基因辨別和表觀遺傳學等,涵蓋了一系列臨床上重要的領域,例如病原微生物和病毒、全身性疾病、藥物基因體學和癌症,相信未來可以打造真正個人化的精準醫療時代。
參考資料
1. Loomis, E.W. et al. (2013) Sequencing the unsequenceable: expanded CGG-repeat alleles of the fragile X gene. Genome Res. 23, 121–128
2. Ardui, S. et al. (2017) Detecting AGG interruptions in male and female FMR1 premutation carriers by single-molecule sequencing. Hum. Mutat. 38, 324–331
3. Ardui, S. et al. (2018) Detecting AGG interruptions in females with a FMR1 premutation by long-read single-molecule sequencing: a 1 year clinical experience. Front. Genet. 9, 150
4. Wenzel, A. et al. (2018) Single molecule real time sequencing in ADTKD-MUC1 allows complete assembly of the VNTR and exact positioning of causative mutations. Sci. Rep. 8, 4170
5. McFarland, K.N. et al. (2015) SMRT sequencing of long tandem nucleotide repeats in SCA10 reveals unique insight of repeat expansion structure. PLoS One 10, e0135906
6. Schule, B. et al. (2017) Parkinson’s disease associated with pure ATXN10 repeat expansion. NPJ Parkinsons Dis. 3, 27
7. Tsai, Y.-C. et al. (2017) Amplification-free, CRISPR-Cas9 targeted enrichment and SMRT sequencing of repeat-expansion disease causative genomic regions. bioRxiv Published online October 16, 2017. http://dx.doi.org/10.1101/203919
8. Hoijer, I. et al. (2018) Detailed analysis of HTT repeat elements in human blood using targeted amplification-free long-read sequencing. Hum. Mutat. Published online June 22, 2018. http://dx.doi.org/10.1002/humu.23580
9. Mitsuhashi, S. et al. (2017) Nanopore-based single molecule sequencing of the D4Z4 array responsible for facioscapulohumeral muscular dystrophy. Sci. Rep. 7, 14789
10. Buermans, H.P. et al. (2017) Flexible and scalable full-length CYP2D6 long amplicon PacBio sequencing. Hum. Mutat. 38, 310–316
11. Qiao, W. et al. (2016) Long-read single molecule real-time full gene sequencing of cytochrome P450-2D6. Hum. Mutat. 37, 315–323
12. Frans, G. et al. (2018) Conventional and single-molecule targeted sequencing method for specific variant detection in IKBKG whilst bypassing the IKBKGP1 pseudogene. J. Mol. Diagn. 20, 195– 202
13. Borras, D.M. et al. (2017) Detecting PKD1 variants in polycystic kidney disease patients by single-molecule long-read sequenc-ing. Hum. Mutat. 38, 870–879
14. Leija-Salazar, M. et al. (2018) Detection of GBA missense muta-tions and other variants using the Oxford Nanopore MinION. bioRxiv Published online March 24, 2018. http://dx.doi.org/ 10.1101/288068
15. Albrecht, V. et al. (2017) Dual redundant sequencing strategy: full-length gene characterisation of 1056 novel and confirmatory HLA alleles. HLA 90, 79–87
16. Mayor, N.P. et al. (2015) HLA typing for the next generation. PLoS One 10, e0127153
17. Roe, D. et al. (2017) Revealing complete complex KIR haplotypes phased by long-read sequencing technology. Genes Immun. 18, 127–134
18. Jain, M. et al. (2018) Linear assembly of a human centromere on the Y chromosome. Nat. Biotechnol. 36, 321–323
19. Chaisson,M.J.P. et al. (2018)Multi-platform discoveryofhaplotype- resolved structural variation in human genomes. bioRxiv Published online September 23, 2017. http://dx.doi.org/10.1101/193144
20. Merker, J.D. et al. (2018) Long-read genome sequencing iden-tifies causal structural variation in a Mendelian disease. Genet. Med. 20, 159–163
21. Reiner, J. et al. (2018) Cytogenomic identification and long-read single molecule real-time (SMRT) sequencing of a Bardet-Biedl Syndrome 9 (BBS9) deletion. NPJ Genomic Med. 3, 3
22. Aneichyk, T. et al. (2018) Dissecting the causal mechanism of X-linked dystonia-parkinsonism by integrating genome and tran-scriptome assembly. Cell 172, 897–909.e21
23. Goncalves, A. et al. (2017) Exonization of an intronic LINE-1 element causing Becker muscular dystrophy as a novel muta-tional mechanism in dystrophin gene. Genes (Basel) 8, 253
24. Cretu Stancu, M. et al. (2017) Mapping and phasing of structural variation in patient genomes using nanopore sequencing. Nat. Commun. 8, 1326
25. Gong, L. et al. (2018) Picky comprehensively detects high-resolution structural variants in nanopore long reads. Nat. Methods 15, 455–460
26. Nattestad, M. et al. (2018) Complex rearrangements and onco-gene amplifications revealed by long-read DNA and RNA sequencing of a breast cancer cell line. Genome Res. Published online June 28, 2018. http://dx.doi.org/10.1101/gr.231100.117
27. Euskirchen, P. et al. (2017) Same-day genomic and epigenomic diagnosis of brain tumors using real-time nanopore sequencing. Acta Neuropathol. 134, 691–703
28. Dumetz, F. et al. (2017) Modulation of aneuploidy in Leishmania donovani during adaptation to different in vitro and in vivo environ-ments and its impact on gene expression. MBio 8, e00599-17
29. Seo, J.S. et al. (2016) De novo assembly and phasing of a Korean human genome. Nature 538, 243–247
30. Shi, L. et al. (2016) Long-read sequencing and de novo assembly of a Chinese genome. Nat. Commun. 7, 12065
31. Chin, C.S. et al. (2016) Phased diploid genome assembly with single-molecule real-time sequencing. Nat. Methods 13, 1050– 1054
32. Miga, K.H., Koren, S., Rhie, A. et al. (2020) Telomere-to-telomere assembly of a complete human X chromosome. Nature 585, 79–84. https://doi.org/10.1038/s41586-020-2547-7
33. Ameur A, Kloosterman WP, Hestand MS. (2019) Single-Molecule Sequencing: Towards Clinical Applications. Trends Biotechnol. 37(1):72-85. doi: 10.1016/j.tibtech.2018.07.013. Epub 2018 Aug 13. PMID: 30115375.
圖爾思生物科技 / 微生物體研究中心
吳雁韻 文案
http://www.toolsbiotech.com/
© BIOTOOLS. All Rights Reserved