30
2016.05
重定序(Re-sequencing)常見專有名詞,你知道幾個呢?
從小到大不管是學習中文還是英文,都需要先學會一些中文詞或英文單字,有了基本的認識才能更深入的去學習。在NGS領域也是一樣,當然要先對專有名詞有基本的認識了解,才能學習起來不會一知半解也能快速的進入狀況摟~~
既然要講重定序常見專有名詞,那當然要先論一下什麼是重定序呢?
全基因體重定序是對已知基因體序列的物種進行不同個體的基因組定序,並在此基礎上對個體或群體進行差異性分析。 基於全基因體重定序技術,可以快速進行篩選,尋找到大量遺傳變異,實現遺傳進化分析、遺傳圖譜建構及重要性狀候選基因的預測。隨著定序成本降低和擁有參考基因體序列物種增多,全基因體重定序成為動植物育種和群體進化研究迅速有效的方法。
那小編就來介紹一下有哪些常見的專有名詞~~
1. 定序深度:
Sequencing depth, 定序得到的鹼基總量(bp)與基因體大小(Genome)的比值,是評價定序量的指標之一。例如:對一個物種的全基因體進行重定序,基因體大小約為5G,定序獲得100G 的數據量,則定序深度為20×。
2. 覆蓋度:
Coverage,覆蓋度是指基因體被定序得到的鹼基覆蓋的比例。
3. 比對率:
Mapping rate,比對到參考基因體上的reads 數目除以有效定序數據的reads數,反映了樣本定序數據與參考基因體的相似性。
4. SNP:
Single nucleotide polymorphism,單核苷酸多型性,主要是指在基因體水平上由單個核苷酸的變異所引起的DNA序列多型性,包含單個鹼基的轉換、顛換等。
5. InDel:
指基因體中小片段的插入和缺失序列。
6. SV:
Structure variation,基因體結構變異,指在染色體上發生了大片段的變異。主要包括染色體大片段的插入和缺失,染色體內部的某塊區域發生重複複製、翻轉顛換、易位、兩條染色體之間發生重組等。
7. CNV:
Copy number variation,基因體拷貝數變異,是基因體變異的一種形式,通常使基因體中大片段的DNA形成非正常的拷貝數量。
8. BSA性狀定位:
Bulked Segregate Analysis,混合分組分析法,針對目標性狀,選擇表型極端差異的親本構建家系,對該家系目標性狀表型極端的子代分別混合得到的兩個樣本池進行全基因體重定序,檢測到的兩池間DNA差異片段即為候選區域,可進一步定位到目標性狀相關的基因或標記。
Bulked Segregate Analysis,混合分組分析法,針對目標性狀,選擇表型極端差異的親本構建家系,對該家系目標性狀表型極端的子代分別混合得到的兩個樣本池進行全基因體重定序,檢測到的兩池間DNA差異片段即為候選區域,可進一步定位到目標性狀相關的基因或標記。
9. 遺傳圖譜:
Genetic map,是指基因或DNA分子標記在染色體上的相對位置與遺傳距離,通常以基因或DNA片段在染色體交換過程中的重組頻率(cM)表示。1cM 表示兩位點在減數分裂中的重組頻率為1%,重組率的值(cM)越高表明兩位點之間遺傳距離越遠,越低表示遺傳距離越近。
10. GWAS:
Genome-wide association study(全基因體關聯分析),是對遺傳多樣性豐富的群體的每個個體進行全基因體重定序,結合目標性狀的表型數據,基於一定的統計方法進行全基因體關聯分析,可以快速獲得影響目標性狀表型變異的染色體區段或基因位點。
11. 群體進化:
指利用全基因體重定序技術獲得某物種自然群體各亞群的基因組信息,挖掘大量的SNP、InDel、SV和CNV等變異信息,然後基於SNP等變異分析群體的遺傳結構、基因交流情況、物種形成機制以及群體進化動態等生物學問題。
12. Hi-C:
High-throughput chromosome conformation capture(高通量染色體捕獲技術),以整個細胞核為研究對象,利用高通量定序技術,結合生物資訊學方法,研究全基因體範圍內整個染色質DNA在空間位置上的關係,捕獲不同基因座位上之間的空間交互,獲得高分辨率的染色質三維結構資訊,同時開發調控基因的DNA元件。
13. 系統進化樹:
13. 系統進化樹:
Phylogenetic tree,又常被叫做系統發生樹、系統演化樹、種系發生樹等,是描述群體間分化順序的分支圖或樹,用來表示群體間的進化(親緣)關係和系統分類。
14. 群體遺傳結構:
指遺傳變異在物種或群體中的一種非隨機分佈。按照地理分佈或其他標準可將一個群體分為若干亞群,處於同一亞群內的不同個體親緣關係較高,而亞群與亞群之間則親緣關係稍遠。群體遺傳結構分析有助於理解進化過程,是群體遺傳學研究的一個重要內容。
15. 選擇性清除:
Selective sweep, 是由於某一點受到較強的自然選擇後,該突變位點相鄰DNA上的核苷酸之間的差異下降或消除現象。當一個新的突變產生,使個體相對於其他群體成員的適應性增加,就可能產生選擇性清除。
16. 連鎖不平衡:
Linkage disequilibrium,又稱等位基因關聯,是指同一條染色體上,兩個等位基因間的非隨機相關。即,當位於同一條染色體的兩個等位基因(A,B)同時存在的概率,大於群體中因隨機分佈而同時出現的概率時,就稱這兩個位點處於連鎖不平衡狀態。
17. 有效群體大小:
Effective population size,指與實際群體有相同基因頻率方差或相同雜合度衰減率的理想群體含量,通常小於絕對的群體大小。它決定了群體平均近交係數增量的大小,反映了群體遺傳結構中基因的平均純合速度,是群體遺傳學研究的一個重要內容。有效群體大小的研究有利於我們更清楚的了解種群進化歷史和復雜性狀的遺傳機制。
重定序領域研究內容多,專業詞彙豐富。小編希望能藉由這些名詞先讓大家對於重定序有一個基本的認識,未來有機會再談談更多重定序相關的知識摟~