22
2016.11
中草藥基因體匯總《續》
上上周小編和大家一起分享了四個中草藥基因體文章解析(中草藥基因體匯總),這次小編再和大家分享四種中草藥基因體定序文章。
唇形科植物,傳統的中草藥,全國大部分地區都有分佈,生於向陽山坡草叢、林邊等地,起初主要用於治療心腦血管疾病,具有活血祛瘀、清心除煩、涼血消癰等功效。
2015年,採用二加三代混合組裝,基因體大小為641 Mb,Contig N50=82.8Kb,Scaffold N50=1.2Mb。預測出34,598個蛋白質編碼基因以及1,644個丹參基因體中特異的基因。
來自於L-苯丙氨酸的迷迭香酸是丹參中重要的藥用成分。本研究用擬南芥中類黃酮合成路徑中相關基因作為參考,挖掘丹參中苯丙素合成關鍵基因,發現在丹參根中表現量最高。 2016年採用二加三代混合組裝方法獲得丹參基因體草圖。基因體大小538 Mb,Contig N50 = 12.38 Kb,Scaffold N50 = 51.02 Kb。最終預測得到了30,478個蛋白質編碼基因,系統演化樹分析丹參與芝麻親緣關係最近,兩者分化於6, 7百萬年前。並對丹參進行了基因家族演化和功能分析。 TPSs和CYPs基因簇(gene cluster)通常與萜類化合物合成中的持續酶活有關。本研究進一步證實了這些基因簇與丹參酮生化合成的關係。系統演化分析表明SmCPS1和SmCPS2簇來源於CPS/CYP76AH的複製(gene duplication)事件。結合基因轉錄體數據,分析了丹參酮合成相關基因各個組織部位的表現量差異。本研究還比較了藥用價值較高的開白色花的丹參基因體與開紫色花的丹參基因體間的遺傳差異。
靈芝是多孔菌科真菌靈芝的子實體,是傳統中國醫藥的標誌,是世界最知名的藥用大型真菌,具有抗癌、抗高血壓、抗病毒和免疫調節活性等功效,靈芝能產生大量的生物活性化合物,其中超過400種已被確定,使靈芝擁有生物活性化合物的細胞“工廠”之稱。
組裝獲得靈芝基因體大小為43.3 Mb,Contig N50=649.7kb,Scaffold N50=1.4Mb。共確定16,113個蛋白編碼基因,基因體序列結合轉錄體分析,對靈芝不同發育階段基因的表現情況進行了探究;基因體比較分析三萜類生化合成相關基因,發現大量編碼CYPs和LSS的相關基因及其共同表現(co-expression)情況,並確定了大量含有CYP基因的基因簇,其中兩個與LSS共同表現。 靈芝擁有一個龐大而完整的木質素過氧化物酶系列,以及漆酶和纖維二糖脫氫酶,這些酶的存在說明靈芝會通過不同的方法分解木質素。
組裝獲得靈芝基因體大小為43.3 Mb,Contig N50=649.7kb,Scaffold N50=1.4Mb。共確定16,113個蛋白編碼基因,基因體序列結合轉錄體分析,對靈芝不同發育階段基因的表現情況進行了探究;基因體比較分析三萜類生化合成相關基因,發現大量編碼CYPs和LSS的相關基因及其共同表現(co-expression)情況,並確定了大量含有CYP基因的基因簇,其中兩個與LSS共同表現。 靈芝擁有一個龐大而完整的木質素過氧化物酶系列,以及漆酶和纖維二糖脫氫酶,這些酶的存在說明靈芝會通過不同的方法分解木質素。
利用二加三代定序組裝,基因體大小1.35 Gb,Contig N50=25.1Kb,Scaffold N50=76.4Kb。重複序列為63.33%,雜合率達到0.48%。共確定35,567個蛋白編碼基因,確定了1,462個鐵皮石斛特有的基因家族,與植物發育光控制、抗病抗逆、木質部及纖維素合成有關。研究分析了鐵皮石斛一些藥用成分的生化合成路徑(biosynthesis pathway),發現與多醣生成相關的蔗糖磷酸合成酶(SPS)和蔗糖合成酶(SuSy)基因發生了大規模複製,分別鑑定出10個SPS和15個SuSy基因。此外,生物鹼也是鐵皮石斛的一種重要生物成分,研究還進一步探究了生物鹼的合成路徑及相關蛋白。
十字花科植物,適宜在高海拔地區生長。是一種純天然食物,營養成分豐富。瑪卡富含高單位營養素,對人體有滋補強身的功能。主要含兩類新的植物活性成分,瑪卡酰胺和瑪卡稀,這兩種物質對平衡人體荷爾蒙分泌有顯著作用,所以瑪卡又被稱為天然荷爾蒙發動機。
用二代組裝獲得基因體大小為743 Mb,Contig N50=81Kb,Scaffold N50=2.4Mb。基因體註釋獲得51,339個蛋白編碼基因和34,846個非蛋白編碼基因,通過比較基因體學(comparative genomics)分析,瑪卡中有9,713個基因家族擴張(expansion),主要包括參與非生物壓力反應(abiotic stress)、激素訊號傳導(hormone signaling transduction pathway)和次生代謝物質合成相關基因。在6, 7百萬年前瑪卡發生過全基因體複製(whole genome duplication)事件,使得瑪卡適應高海拔的極端環境。 全基因體複製事件使得參加葉片發育的基因RCO、KNOX和CUC增加,葉片邊緣表現出鋸齒狀,表面積減少。參與抗寒和抗UV-B的基因增加。瑪卡基因體中與春化作用相關基因遺失,使得瑪卡不存在明顯的春化現象。
參考文獻
用二代組裝獲得基因體大小為743 Mb,Contig N50=81Kb,Scaffold N50=2.4Mb。基因體註釋獲得51,339個蛋白編碼基因和34,846個非蛋白編碼基因,通過比較基因體學(comparative genomics)分析,瑪卡中有9,713個基因家族擴張(expansion),主要包括參與非生物壓力反應(abiotic stress)、激素訊號傳導(hormone signaling transduction pathway)和次生代謝物質合成相關基因。在6, 7百萬年前瑪卡發生過全基因體複製(whole genome duplication)事件,使得瑪卡適應高海拔的極端環境。 全基因體複製事件使得參加葉片發育的基因RCO、KNOX和CUC增加,葉片邊緣表現出鋸齒狀,表面積減少。參與抗寒和抗UV-B的基因增加。瑪卡基因體中與春化作用相關基因遺失,使得瑪卡不存在明顯的春化現象。
參考文獻
[1] Zhang G. Hybrid de novo genome assembly of the Chinese herbal plant danshen ( Salvia miltiorrhiza Bunge)[J]. GigaScience, 2015, 4(1):1-4.
[2] Xu H, Song J, Luo H, et al. Analysis of the genome sequence of the medicinal plant Salvia miltiorrhiza[J]. Molecular Plant, 2016, 9(6):949-952.
[3] Chen S, Xu J, Liu C, et al. Genome sequence of the model medicinal mushroom Ganoderma lucidum[J]. Nature Communications, 2012, 3(2):177-180.
[4] Liang Y, Xiao W, Hui L, et al. The Genome of Dendrobium officinale, Illuminates the Biology of the Important Traditional Chinese Orchid Herb[J]. Molecular Plant, 2015, 8(6):922-934.
[5] Sheng J, Chen W, Dong Y, et al. Genome of octoploid plant maca (Lepidium meyenii) illuminates genomic basis for high altitude adaptation in the central Andes[J]. Biorxiv, 2015.