20
2021.10
【SMOOTH-seq:單細胞定序新方法】
原創文章 引用請註明出處
單細胞定序可用來研究細胞與細胞之間的異質性,或偵測特定細胞基因突變,像是拷貝數目變異跟點突變。過去有多種技術可應用於單細胞放大,像是 DOP-PCR [1]、multiple displacement amplification (MDA) [2]、multiple annealing and looping-based amplification cycles (MALBAC) [3] 等。然而,這些技術都用來搭配次世代定序技術平台,擁有高準確度卻局限了讀長,適合偵測較小的基因變異。在 2021 年中旬時, SMOOTH-seq 的文獻問世,後續 PacBio 也在線上 webinar 中提到此應用,主題為Single-Cell Omics Sequencing Technology: The Third Generation。到底 SMOOTH-seq 是什麼呢?這篇文章來帶大家一探究竟。
開始講 SMOOTH-seq 之前,先介紹一下什麼是 Tn5 Transposase
轉座子(transposons)可以在基因間不同位置跳來跳去,第一個被發現的轉座子是由Barbara McClintock在玉米中找到的[4]。而本篇主角 Tn5 轉座子來自埃希氏菌屬 (Escherichia cdi), Tn5 轉座子核心由三個抗生素編碼序列組成,兩端含有 IS50 倒轉序列,分別為 IS50L、IS50R (圖1A),可做出 Tn5 轉座子 (Tnp)。 IS50 含有約 19 bp 的倒轉端,稱為 OE (outside ends) 跟 IE (inside ends) [5]。當換位發生時, Tn5 轉座子會結合至 OE 上形成 Tnp-OE 複合體,形成複合體的 Tnp C端具有切割 DNA 的能力, Tnp 活化水分子水解 DNA 並在末端形成親核基團,與互補股形成髮夾結構,最後以親核基攻擊目標 DNA 並進行 DNA 鏈轉移,完成跳轉(圖1B)。可快速切割及貼上的特性,讓 Tn5 轉座子可隨機插入 adaptors/barcodes 至 DNA 中,利於後續 PCR 放大跟定序,也在不同領域中有所應用。例如:判讀人類細胞 3D 結構[6]、 CpG 甲基化區域的功能註解[7]、大範圍定序(Mate-pair)中生物素的導入[8]、染色體的視覺化(ATAC-Seq)[9]和單細胞單核苷酸多態性的偵測(LIANTI)[10] (圖1C)。
【圖一】
什麼是SMOOTH-seq?
SMOOTH-seq 是利用插入轉座子後放大的長片段去做單分子即時定序,可應用於偵測單細胞的結構變異或分析染色體外環狀 DNA (extra-chromosomal circular DNAs, ecDNAs)。使用 Tn5 轉座子搭配 PacBio 單分子即時定序技術,克服了先前短讀長的限制,使得定序片段能夠輕易偵測結構變異等較長的異常。 SMOOTH-seq 必須克服三代定序的樣品上機濃度限制,使得單細胞 DNA 量從皮克 (picograms) 等級達到上機需求的微克 (micrograms) 等級。除此之外,不同於先前的設計, SMOOTH-seq 將 Tn5 轉座子的轉接子序列從先前的兩個改為單一轉接子 (adaptor),此方法可透過轉座 PCR 得到所有原始 DNA 片段,而不是由不同轉接子提供的各 50% 基因體片段。搭配各種試劑、酵素及流程的優化,使得此方法可直接應用於三代定序技術平台上 (圖2)。定序結果: 聚合酶平均讀長為 60 kb、準確度可達 Q30,且達 96% 的數據可對應到人類基因參考資料庫中。
【圖二】
SMOOTH-seq偵測結構變異的結果
研究團段建立了兩個 K562 骨髓性白血病細胞株,運用 pbsv 去偵測其單細胞結構變異並利用 bulk 定序結果作為比對。在單細胞定序結果中,偵測結構變異準確度在不同株分別為 76.9% 和 75.2% 。在所有變異中,插入變異(insertions)擁有最高的準確度為 87% 和 84% ,缺失變異(deletions)位居第二,而次世代定序中最難被偵測到的複製變異(duplications)其準確度不超過 60% (圖3B)。如同預期的,偵測結構變異的準確率會隨著同來源細胞數目越多而增加。當有越多細胞可以證明發現的結構變異時,其假陽性率也會因而下降,從單一細胞數據 48.6% 下降至兩顆以上細胞支持數據的 17.8% (圖3C)。而後續分析也發現,在兩株 K562 細胞中,發現的結構變異也是高度相似的 (圖3D)。
【圖三】
SMOOTH-seq偵測環狀DNA的結果
染色體外環狀 DNA (ecDNAs) 常被發現於致癌階段、與致癌基因相關,其大小可從 kb 大至 Mb 等級。為了使得 SMOOTH-seq 能夠檢測環狀 DNA ,本篇研究特別發展出一流程(圖4A)。當 Tn5 轉座子結合至 ecDNA 上時,可將環狀的 DNA 分子放大為單一線性片段,運用 SMOOTH-seq 長讀長的特性,使得小於 10 kb 的 ecDNA 可以在單一讀序中獲得完整序列資訊。接著,使用粒線體環狀 DNA 作為例子,定序結果獲得最長讀長為 16,550 bp 片段,幾乎靠近全長序列 16,569 bp 。偵測到的 ecDNA 範圍落在 5 kb 至 1 Mb ,共發現 417 個基因在 ecDNA 區域中,這些基因主要與免疫及細胞分裂有關 (圖4B)。
【圖四】
總結來說, SMOOTH-seq 在偵測結構變異上有良好的表現,同之前的單細胞全基因體定序方法, SMOOTH-seq 也可以偵測 CNV、SNV 等變異,但需要較深的定序深度以達到其準確度。而在環狀 DNA 偵測的應用上,當定序片段小於 10 kb 時, SMOOTH-seq 可在單一讀序中得到完整目標序列。反之,待定序環狀 DNA 太長時,只能以環狀的形式被定序,此情況下將難以偵測大片段重複序列。
參考資料
1. Navin, Nicholas, et al. "Tumour evolution inferred by single-cell sequencing." Nature 472.7341 (2011): 90-94.
2. Wang, Jianbin, et al. "Genome-wide single-cell analysis of recombination activity and de novo mutation rates in human sperm." Cell 150.2 (2012): 402-412.
3. Zong, Chenghang, et al. "Genome-wide detection of single-nucleotide and copy-number variations of a single human cell." Science 338.6114 (2012): 1622-1626.
4. Carnell, Sonya C., et al. "Role in virulence and protective efficacy in pigs of Salmonella enterica serovar Typhimurium secreted components identified by signature-tagged mutagenesis." Microbiology 153.6 (2007): 1940-1952.
5. Blot, Michel, Joseph Heitman, and Werner Arber. "Tn5‐mediated bleomycin resistance in Escherichia coli requires the expression of host genes." Molecular microbiology 8.6 (1993): 1017-1024.
6. Tan, Longzhi, et al. "Three-dimensional genome structures of single diploid human cells." Science 361.6405 (2018): 924-928.
7. Adey, Andrew, and Jay Shendure. "Ultra-low-input, tagmentation-based whole-genome bisulfite sequencing." Genome research 22.6 (2012): 1139-1143.
8. Arlt, Martin F., et al. "Comparison of constitutional and replication stress-induced genome structural variation by SNP array and mate-pair sequencing." Genetics 187.3 (2011): 675-683.
9. Chen, Xingqi, et al. "ATAC-see reveals the accessible genome by transposase-mediated imaging and sequencing." Nature methods 13.12 (2016): 1013-1020.
10. Chen, Chongyi, et al. "Single-cell whole-genome analyses by Linear Amplification via Transposon Insertion (LIANTI)." Science 356.6334 (2017): 189-194.
單細胞定序可用來研究細胞與細胞之間的異質性,或偵測特定細胞基因突變,像是拷貝數目變異跟點突變。過去有多種技術可應用於單細胞放大,像是 DOP-PCR [1]、multiple displacement amplification (MDA) [2]、multiple annealing and looping-based amplification cycles (MALBAC) [3] 等。然而,這些技術都用來搭配次世代定序技術平台,擁有高準確度卻局限了讀長,適合偵測較小的基因變異。在 2021 年中旬時, SMOOTH-seq 的文獻問世,後續 PacBio 也在線上 webinar 中提到此應用,主題為Single-Cell Omics Sequencing Technology: The Third Generation。到底 SMOOTH-seq 是什麼呢?這篇文章來帶大家一探究竟。
開始講 SMOOTH-seq 之前,先介紹一下什麼是 Tn5 Transposase
轉座子(transposons)可以在基因間不同位置跳來跳去,第一個被發現的轉座子是由Barbara McClintock在玉米中找到的[4]。而本篇主角 Tn5 轉座子來自埃希氏菌屬 (Escherichia cdi), Tn5 轉座子核心由三個抗生素編碼序列組成,兩端含有 IS50 倒轉序列,分別為 IS50L、IS50R (圖1A),可做出 Tn5 轉座子 (Tnp)。 IS50 含有約 19 bp 的倒轉端,稱為 OE (outside ends) 跟 IE (inside ends) [5]。當換位發生時, Tn5 轉座子會結合至 OE 上形成 Tnp-OE 複合體,形成複合體的 Tnp C端具有切割 DNA 的能力, Tnp 活化水分子水解 DNA 並在末端形成親核基團,與互補股形成髮夾結構,最後以親核基攻擊目標 DNA 並進行 DNA 鏈轉移,完成跳轉(圖1B)。可快速切割及貼上的特性,讓 Tn5 轉座子可隨機插入 adaptors/barcodes 至 DNA 中,利於後續 PCR 放大跟定序,也在不同領域中有所應用。例如:判讀人類細胞 3D 結構[6]、 CpG 甲基化區域的功能註解[7]、大範圍定序(Mate-pair)中生物素的導入[8]、染色體的視覺化(ATAC-Seq)[9]和單細胞單核苷酸多態性的偵測(LIANTI)[10] (圖1C)。
【圖一】
什麼是SMOOTH-seq?
SMOOTH-seq 是利用插入轉座子後放大的長片段去做單分子即時定序,可應用於偵測單細胞的結構變異或分析染色體外環狀 DNA (extra-chromosomal circular DNAs, ecDNAs)。使用 Tn5 轉座子搭配 PacBio 單分子即時定序技術,克服了先前短讀長的限制,使得定序片段能夠輕易偵測結構變異等較長的異常。 SMOOTH-seq 必須克服三代定序的樣品上機濃度限制,使得單細胞 DNA 量從皮克 (picograms) 等級達到上機需求的微克 (micrograms) 等級。除此之外,不同於先前的設計, SMOOTH-seq 將 Tn5 轉座子的轉接子序列從先前的兩個改為單一轉接子 (adaptor),此方法可透過轉座 PCR 得到所有原始 DNA 片段,而不是由不同轉接子提供的各 50% 基因體片段。搭配各種試劑、酵素及流程的優化,使得此方法可直接應用於三代定序技術平台上 (圖2)。定序結果: 聚合酶平均讀長為 60 kb、準確度可達 Q30,且達 96% 的數據可對應到人類基因參考資料庫中。
【圖二】
SMOOTH-seq偵測結構變異的結果
研究團段建立了兩個 K562 骨髓性白血病細胞株,運用 pbsv 去偵測其單細胞結構變異並利用 bulk 定序結果作為比對。在單細胞定序結果中,偵測結構變異準確度在不同株分別為 76.9% 和 75.2% 。在所有變異中,插入變異(insertions)擁有最高的準確度為 87% 和 84% ,缺失變異(deletions)位居第二,而次世代定序中最難被偵測到的複製變異(duplications)其準確度不超過 60% (圖3B)。如同預期的,偵測結構變異的準確率會隨著同來源細胞數目越多而增加。當有越多細胞可以證明發現的結構變異時,其假陽性率也會因而下降,從單一細胞數據 48.6% 下降至兩顆以上細胞支持數據的 17.8% (圖3C)。而後續分析也發現,在兩株 K562 細胞中,發現的結構變異也是高度相似的 (圖3D)。
【圖三】
SMOOTH-seq偵測環狀DNA的結果
染色體外環狀 DNA (ecDNAs) 常被發現於致癌階段、與致癌基因相關,其大小可從 kb 大至 Mb 等級。為了使得 SMOOTH-seq 能夠檢測環狀 DNA ,本篇研究特別發展出一流程(圖4A)。當 Tn5 轉座子結合至 ecDNA 上時,可將環狀的 DNA 分子放大為單一線性片段,運用 SMOOTH-seq 長讀長的特性,使得小於 10 kb 的 ecDNA 可以在單一讀序中獲得完整序列資訊。接著,使用粒線體環狀 DNA 作為例子,定序結果獲得最長讀長為 16,550 bp 片段,幾乎靠近全長序列 16,569 bp 。偵測到的 ecDNA 範圍落在 5 kb 至 1 Mb ,共發現 417 個基因在 ecDNA 區域中,這些基因主要與免疫及細胞分裂有關 (圖4B)。
【圖四】
總結來說, SMOOTH-seq 在偵測結構變異上有良好的表現,同之前的單細胞全基因體定序方法, SMOOTH-seq 也可以偵測 CNV、SNV 等變異,但需要較深的定序深度以達到其準確度。而在環狀 DNA 偵測的應用上,當定序片段小於 10 kb 時, SMOOTH-seq 可在單一讀序中得到完整目標序列。反之,待定序環狀 DNA 太長時,只能以環狀的形式被定序,此情況下將難以偵測大片段重複序列。
參考資料
1. Navin, Nicholas, et al. "Tumour evolution inferred by single-cell sequencing." Nature 472.7341 (2011): 90-94.
2. Wang, Jianbin, et al. "Genome-wide single-cell analysis of recombination activity and de novo mutation rates in human sperm." Cell 150.2 (2012): 402-412.
3. Zong, Chenghang, et al. "Genome-wide detection of single-nucleotide and copy-number variations of a single human cell." Science 338.6114 (2012): 1622-1626.
4. Carnell, Sonya C., et al. "Role in virulence and protective efficacy in pigs of Salmonella enterica serovar Typhimurium secreted components identified by signature-tagged mutagenesis." Microbiology 153.6 (2007): 1940-1952.
5. Blot, Michel, Joseph Heitman, and Werner Arber. "Tn5‐mediated bleomycin resistance in Escherichia coli requires the expression of host genes." Molecular microbiology 8.6 (1993): 1017-1024.
6. Tan, Longzhi, et al. "Three-dimensional genome structures of single diploid human cells." Science 361.6405 (2018): 924-928.
7. Adey, Andrew, and Jay Shendure. "Ultra-low-input, tagmentation-based whole-genome bisulfite sequencing." Genome research 22.6 (2012): 1139-1143.
8. Arlt, Martin F., et al. "Comparison of constitutional and replication stress-induced genome structural variation by SNP array and mate-pair sequencing." Genetics 187.3 (2011): 675-683.
9. Chen, Xingqi, et al. "ATAC-see reveals the accessible genome by transposase-mediated imaging and sequencing." Nature methods 13.12 (2016): 1013-1020.
10. Chen, Chongyi, et al. "Single-cell whole-genome analyses by Linear Amplification via Transposon Insertion (LIANTI)." Science 356.6334 (2017): 189-194.
圖爾思生物科技 / 微生物體研究中心
許瑄珉 文案