12
2021.05
CRISPR-Cas9 x PacBio or Nanopore= Ace (上)
原創文章 引用請註明出處
各位觀眾~四張Ace!!
相信有慧根的讀者肯定已經猜到今天的主題ˊ_>ˋ
沒錯,今天我們就來聊聊怎麼樣從龐大基因體中找出你想要的目標Ace區段!
相信很多研究者在經過一開始的廣泛篩選後,到最後都會有一個鎖定的研究目標,在這個階段我們就可以使用目標區間定序(Target Sequencing)在只感興趣的目標基因區域進定序,這個設計可以減少定序的人力物力成本,也能提高該區間定序的覆蓋度。二代定序目前常見的方法可透過兩種主流技術: PCR擴增以及藉由探針捕獲目標區段兩種策略(Fig.1),但這兩種方法都需要PCR擴增,而PCR擴增受制於酵素性能,對於目標區域的長度有一定的限制,且會遺失鹼基修飾的資訊,也容易導入PCR造成的序列偏差,而探針捕獲還不能用於長讀長定序。
(Fig.1)
由於目前大規模使用的二代定序短讀長的技術限制,人們對重複序列擴增引起的疾病分子機制研究存在著巨大的挑戰。而三代定序的優勢在於讀長長且不在定序過程中進行擴增,所以對基因體DNA而言還能保留鹼基修飾的訊息,且不容易導入系統性錯誤,但目前很多建庫仍是基於PCR方法,因此Pacific Biosciences(PacBio)與Oxford Nanopore Technologies(ONT)不約而同推出了應用CRISPR-Cas9技術對目標區域直接剪切後直接將定序的Adaptor選擇性的連接到目標片段的切割點進行建庫的方法,似乎能一舉解決上述難題。
在使用CRISPR-Cas9技術進行擴增之前,我們需要針對有興趣的目標區域設計以及選擇CRISPR RNA oligonucleotides (crRNA):
crRNAs的設計分為下列四個步驟: (以下使用ATXN10 repeat locus做為範例)
1. 使用常見的SNPs進行gDNA序列的檢索
2. 產生完成之crRNA設計序列
3. 選擇合適之crRNA設計序列
4. 測試所選之crRNA設計序列
使用常見的SNPs進行gDNA序列的檢索 在此步驟中,檢索包含目標區域的5,000 bp gDNA序列,以準備產生crRNA設計序列。使用能夠標記序列中常見SNP的檢索工具。若常見SNP位於crRNA設計序列或PAM位點內的可能會改變gRNA-Cas9複合物中crRNA的結合效率,造成目標區域定序的讀取次數減少。
i. 首先進入UCSC Genome Browser網站(https://genome-asia.ucsc.edu/cgi-bin/hgGateway?redirect=manual&source=genome.ucsc.edu),選擇最新之參考基因體,輸入有興趣之區段位置e.g. ATXN10 repeat locus (chr22:45,795,355-45,795,424; GRCh38/hg38),點擊”GO”。
(Fig.2)
ii. 在下一個頁面中,向下滾動至“Variation”部分,並確保至少一個“Common SNPs”選項中的設置為“full”。
(Fig.3)
iii. 在同一頁面中,至網頁頂部的“View”下拉式選單選擇“ DNA”。
(Fig.4)
iv. 檢索目標區域周圍的5,000個鹼基(每側2500 bp)。 在下一個頁面中,於“Sequence Retrieval Region Options”部分,上游和下游鹼基中輸入2,500 bp。點選” Extended Case/Color Options”按鈕跳至下一頁面並進行SNPs的標註。 v.
(Fig.5)
vi. 選擇所需的SNP標記方式,然後點擊“Submit”按鈕。
(Fig.6)
vii. 將產生的目標序列複製到Microsoft Word中,並標記感興趣的區域(下面以黃底標示)。 請注意,常見SNP已按照上列的指示進行標記完成。
(Fig.7)
產生完成之crRNA設計序列
在此步驟中,將檢索到的序列使用線上CRISPR-Cas9設計工具以生成多個crRNA設計序列。下列說明使用Broad Institute GPP Web網站(https://portals.broadinstitute.org/gppx/crispick/public)上的CRISPick工具。該工具生成的設計與No-Amp protocol相容。
i. 選擇檢索到的前500 bp目標序列,貼至CRISPick頁面。依照順序選擇相”Human GRCh38 (NCBI RefSeq v109)”、” CRISPRko”、” SpyoCas9(NGG)”。No-Amp protocol (PacBio)使用化膿性鏈球菌的Cas9核酸酶,並與特定的PAM序列NGG相關。
ii. 勾選“Report Unpicked Sequences?”,並確認不是機器人後,點擊“Submit”按鈕以產出結果。
(Fig.8)
iii. 點擊”Picking Results”,下載sgRNA候選序列表。(注意: “sgRNA序列”與”crRNA序列”同義)
(Fig.9)
iv. 選擇檢索到的後500 bp目標序列,重複此環節中的步驟i至iii。在下一部分中,將在序列的前500 bp和後500 bp中選擇位於目標區域側邊的crRNA設計序列。預期在CRISPR-Cas9剪切後,將產生一個包含目標區域的4-5 kb片段。
選擇合適之crRNA設計序列 在此步驟中,基於方向和唯一性,從CRISPR-Cas9設計工具的結果中選擇crRNA設計序列 然後將它們對回到在設計過程中較早獲得的gDNA目標序列,以確定設計中SNP的存在。最後進行選擇以進行測試。 在上個步驟之後,下面分別使用5 kb目標序列的前500 bp和後500 bp生成的“ Picking Results”檔案。 i. 在Microsoft Excel中打開“ Picking Results”檔案,並將每個文件另存為Excel Workbook(.xlsx)。 ii. 將每個表均按“Combined Rank”排序,如下面的表1所示。僅顯示了有助於將設計序列對回到5 kb目標序列的候選序列。
iii. 確認crRNA設計與No-Amp protocol (PacBio)兼容。
crRNA設計序列的方向對於No-Amp target sequencing protocol至關重要。 gRNA-Cas9複合物會在相關的PAM位點上游的3 bp進行剪切。剪切後,gRNA-Cas9複合物仍與剪切位點5'側的DNA連接,導致相關DNA的覆蓋率較低或沒有任何覆蓋。因此,相容的crRNA設計必須以3'末端指向目標區域,如下圖所示。以正確的crRNA設計方向之CRISPR-Cas9剪切後,gRNA-Cas9複合物的存在就不會造成妨礙。
iv. 將選定的crRNA設計序列對回目標序列,這些設計序列應為正確方向且對5 kb目標序列而言是唯一的,以便確定crRNA和下游PAM序列中常見SNP的存在。
v. 選擇一組不包含常見SNP的測試設計序列。 仔細檢查所有設計序列,以確認crRNA序列和下游PAM序列中是否存在常見SNP。由於並非所有crRNA在實際測試中都是同樣效率的,因此可以多選擇幾種crRNA設計序列進行測試。
vi. 建議對forward (sense)及reverse (antisense)側邊方向按綜合排名順序對前3種相容設計序列進行測試。 測試所選之crRNA設計序列
建議在為目標區域選擇最終的crRNA設計序列之前,先訂購和測試幾種設計。 可以使用No-Amp方法或包含crRNA側邊序列的質粒來測試crRNA設計。這是針對少量目標區域有效,且更經濟的測試方法,因為可以直接通過瓊脂糖凝膠電泳而不是定序來確認CRISPR-Cas9剪切後之產物。
以上是crRNA的設計步驟,由於使用CRISPR-Cas9建庫相對是比較客製化的選擇,所以篇幅比較大,小編寫累了…相信讀者也看累了! 寫到這立馬改變心意決定分(上)(下)集… 那麼,我們下下篇再來探討使用CRISPR-Cas9在PacBio以及ONT中要如何進行建庫以及一些相關應用喔! 我們下次見~~~小編補血去!
參考資料
1. Reference-Guide-Designing-CRISPR-Cas9-RNA-Oligonucleotides-for-the-No-Amp-Targeted-Sequencing-Procedure
2. Application-Brief-No-Amp-targeted-sequencing-Best-Practices
各位觀眾~四張Ace!!
相信有慧根的讀者肯定已經猜到今天的主題ˊ_>ˋ
沒錯,今天我們就來聊聊怎麼樣從龐大基因體中找出你想要的目標Ace區段!
相信很多研究者在經過一開始的廣泛篩選後,到最後都會有一個鎖定的研究目標,在這個階段我們就可以使用目標區間定序(Target Sequencing)在只感興趣的目標基因區域進定序,這個設計可以減少定序的人力物力成本,也能提高該區間定序的覆蓋度。二代定序目前常見的方法可透過兩種主流技術: PCR擴增以及藉由探針捕獲目標區段兩種策略(Fig.1),但這兩種方法都需要PCR擴增,而PCR擴增受制於酵素性能,對於目標區域的長度有一定的限制,且會遺失鹼基修飾的資訊,也容易導入PCR造成的序列偏差,而探針捕獲還不能用於長讀長定序。
(Fig.1)
由於目前大規模使用的二代定序短讀長的技術限制,人們對重複序列擴增引起的疾病分子機制研究存在著巨大的挑戰。而三代定序的優勢在於讀長長且不在定序過程中進行擴增,所以對基因體DNA而言還能保留鹼基修飾的訊息,且不容易導入系統性錯誤,但目前很多建庫仍是基於PCR方法,因此Pacific Biosciences(PacBio)與Oxford Nanopore Technologies(ONT)不約而同推出了應用CRISPR-Cas9技術對目標區域直接剪切後直接將定序的Adaptor選擇性的連接到目標片段的切割點進行建庫的方法,似乎能一舉解決上述難題。
在使用CRISPR-Cas9技術進行擴增之前,我們需要針對有興趣的目標區域設計以及選擇CRISPR RNA oligonucleotides (crRNA):
crRNAs的設計分為下列四個步驟: (以下使用ATXN10 repeat locus做為範例)
1. 使用常見的SNPs進行gDNA序列的檢索
2. 產生完成之crRNA設計序列
3. 選擇合適之crRNA設計序列
4. 測試所選之crRNA設計序列
使用常見的SNPs進行gDNA序列的檢索 在此步驟中,檢索包含目標區域的5,000 bp gDNA序列,以準備產生crRNA設計序列。使用能夠標記序列中常見SNP的檢索工具。若常見SNP位於crRNA設計序列或PAM位點內的可能會改變gRNA-Cas9複合物中crRNA的結合效率,造成目標區域定序的讀取次數減少。
i. 首先進入UCSC Genome Browser網站(https://genome-asia.ucsc.edu/cgi-bin/hgGateway?redirect=manual&source=genome.ucsc.edu),選擇最新之參考基因體,輸入有興趣之區段位置e.g. ATXN10 repeat locus (chr22:45,795,355-45,795,424; GRCh38/hg38),點擊”GO”。
(Fig.2)
ii. 在下一個頁面中,向下滾動至“Variation”部分,並確保至少一個“Common SNPs”選項中的設置為“full”。
(Fig.3)
iii. 在同一頁面中,至網頁頂部的“View”下拉式選單選擇“ DNA”。
(Fig.4)
iv. 檢索目標區域周圍的5,000個鹼基(每側2500 bp)。 在下一個頁面中,於“Sequence Retrieval Region Options”部分,上游和下游鹼基中輸入2,500 bp。點選” Extended Case/Color Options”按鈕跳至下一頁面並進行SNPs的標註。 v.
(Fig.5)
vi. 選擇所需的SNP標記方式,然後點擊“Submit”按鈕。
(Fig.6)
vii. 將產生的目標序列複製到Microsoft Word中,並標記感興趣的區域(下面以黃底標示)。 請注意,常見SNP已按照上列的指示進行標記完成。
(Fig.7)
產生完成之crRNA設計序列
在此步驟中,將檢索到的序列使用線上CRISPR-Cas9設計工具以生成多個crRNA設計序列。下列說明使用Broad Institute GPP Web網站(https://portals.broadinstitute.org/gppx/crispick/public)上的CRISPick工具。該工具生成的設計與No-Amp protocol相容。
i. 選擇檢索到的前500 bp目標序列,貼至CRISPick頁面。依照順序選擇相”Human GRCh38 (NCBI RefSeq v109)”、” CRISPRko”、” SpyoCas9(NGG)”。No-Amp protocol (PacBio)使用化膿性鏈球菌的Cas9核酸酶,並與特定的PAM序列NGG相關。
ii. 勾選“Report Unpicked Sequences?”,並確認不是機器人後,點擊“Submit”按鈕以產出結果。
(Fig.8)
iii. 點擊”Picking Results”,下載sgRNA候選序列表。(注意: “sgRNA序列”與”crRNA序列”同義)
(Fig.9)
iv. 選擇檢索到的後500 bp目標序列,重複此環節中的步驟i至iii。在下一部分中,將在序列的前500 bp和後500 bp中選擇位於目標區域側邊的crRNA設計序列。預期在CRISPR-Cas9剪切後,將產生一個包含目標區域的4-5 kb片段。
選擇合適之crRNA設計序列 在此步驟中,基於方向和唯一性,從CRISPR-Cas9設計工具的結果中選擇crRNA設計序列 然後將它們對回到在設計過程中較早獲得的gDNA目標序列,以確定設計中SNP的存在。最後進行選擇以進行測試。 在上個步驟之後,下面分別使用5 kb目標序列的前500 bp和後500 bp生成的“ Picking Results”檔案。 i. 在Microsoft Excel中打開“ Picking Results”檔案,並將每個文件另存為Excel Workbook(.xlsx)。 ii. 將每個表均按“Combined Rank”排序,如下面的表1所示。僅顯示了有助於將設計序列對回到5 kb目標序列的候選序列。
iii. 確認crRNA設計與No-Amp protocol (PacBio)兼容。
crRNA設計序列的方向對於No-Amp target sequencing protocol至關重要。 gRNA-Cas9複合物會在相關的PAM位點上游的3 bp進行剪切。剪切後,gRNA-Cas9複合物仍與剪切位點5'側的DNA連接,導致相關DNA的覆蓋率較低或沒有任何覆蓋。因此,相容的crRNA設計必須以3'末端指向目標區域,如下圖所示。以正確的crRNA設計方向之CRISPR-Cas9剪切後,gRNA-Cas9複合物的存在就不會造成妨礙。
iv. 將選定的crRNA設計序列對回目標序列,這些設計序列應為正確方向且對5 kb目標序列而言是唯一的,以便確定crRNA和下游PAM序列中常見SNP的存在。
v. 選擇一組不包含常見SNP的測試設計序列。 仔細檢查所有設計序列,以確認crRNA序列和下游PAM序列中是否存在常見SNP。由於並非所有crRNA在實際測試中都是同樣效率的,因此可以多選擇幾種crRNA設計序列進行測試。
vi. 建議對forward (sense)及reverse (antisense)側邊方向按綜合排名順序對前3種相容設計序列進行測試。 測試所選之crRNA設計序列
建議在為目標區域選擇最終的crRNA設計序列之前,先訂購和測試幾種設計。 可以使用No-Amp方法或包含crRNA側邊序列的質粒來測試crRNA設計。這是針對少量目標區域有效,且更經濟的測試方法,因為可以直接通過瓊脂糖凝膠電泳而不是定序來確認CRISPR-Cas9剪切後之產物。
以上是crRNA的設計步驟,由於使用CRISPR-Cas9建庫相對是比較客製化的選擇,所以篇幅比較大,小編寫累了…相信讀者也看累了! 寫到這立馬改變心意決定分(上)(下)集… 那麼,我們下下篇再來探討使用CRISPR-Cas9在PacBio以及ONT中要如何進行建庫以及一些相關應用喔! 我們下次見~~~小編補血去!
參考資料
1. Reference-Guide-Designing-CRISPR-Cas9-RNA-Oligonucleotides-for-the-No-Amp-Targeted-Sequencing-Procedure
2. Application-Brief-No-Amp-targeted-sequencing-Best-Practices
圖爾思生物科技 / 微生物體研究中心
吳雁韻 文案