论文部分内容阅读
毛竹(Phyllostachys edulis)是我国最重要的经济竹种,产生了巨大的经济、生态和社会效益。厚壁毛竹(Phyllostachys edulis‘Pachyloen’)是毛竹种下特异的一份竹壁特厚、材笋优、抗性强、遗传稳定的优异种质,具有重要的生产和科研价值。厚壁毛竹的种质性状研究有了较为系统成果,本研究第一次从全基因组层面,开展厚壁毛竹重测序,研究其重要种质性状的分子形成机制。同时,采集同样具有厚壁种质性状的实肚竹(Phyllostachys nidularia f.farcta)、实心竹(Phyllostachys heteroclada f.decurtata),以及具有薄壁种质性状的火筒竹(Schizostachyum dumetorum var.xinwuense),开展全基因比较分析,通过基因集差减的方法,研究厚壁性状等的候选基因。主要结果如下:(1)利用重测序方法,获得厚壁毛竹基因组12×测序深度的数据24.50 Gb。以毛竹全基因组作为参考,匹配其上的reads数245 024 627个,匹配率97.43%。获得实肚竹的测序数据为33.01 Gb,匹配到毛竹基因组的reads数为89 627 635个,匹配率为37.93%。获得实心竹的测序数据为28.29 Gb,匹配到毛竹基因组的reads数为个78 878 955,匹配率为38.97%。获得火筒竹的测序数据为34.55 Gb,匹配到毛竹基因组的reads数为8 009 527个,匹配率为1.44%。(2)SNP:获得厚壁毛竹1 718 960个SNPs,平均1 093个碱基出现一个突变,转换颠换(Ts/Tv)比值2.93。找到实肚竹19 727 178个SNPs,平均94个碱基出现一个突变,转化颠换比值3.05。得到实心竹18 041 778个SNPs,平均103个碱基出现一个突变,转换颠换比值3.00。“薄壁性状”的火筒竹发现1 683 311个SNPs,平均958个碱基出现一个突变,转换颠换比值1.54。起编码作用的外显子区SNPs占其总SNPs比例依次是火筒竹(37.97%)>实心竹(2.56%)>厚壁毛竹(2.53%)>实肚竹(2.25%)。(3)In Del:厚壁毛竹72 337个,其中插入38 040个,缺失34 297个;实肚竹In Dels数量489 064个,其中插入229 721个,缺失259 343个;实心竹In Dels数量335 745个,其中插入159 491个,缺失176 254个;火筒竹In Dels数量31 939个,插入14 778个,缺失14 778个;外显子区In Dels占比:火筒竹(18.42%)>厚壁毛竹(3.41%)>实心竹(3.66%)>实肚竹(2.91%)。4种材料的In Dels都是1bp的短序列最多,In Del导致了移码突变的大量出现,是基因组进化的重要推动力。(4)研究发现,厚壁毛竹发生的复制删除(CNV)属于高频类型。共检测获得558 437个CNVs,其中为复制的158 185个,为删除的400 252个。这些CNV不均匀分布在5 269个基因上,绝大多数基因复制/删除少于10个,仅有20个基因的复制/删除大于10个。其中,表征为蛋白表达的PH01000028G2090基因的CNVs最多(124个)。(5)GO富集:通过与毛竹参考基因组进行比对,发现厚壁毛竹6 631个差异基因,富集到生物学过程(Biological process)4 243个,细胞组成(Cellular component)1 798个,分子功能(Molecular functiom)6 111个。发现实肚竹17 328个差异基因,富集到生物学过程(Biological process)10 5384个,细胞组成(Cellular component)4 730个,分子功能(Molecular functiom)15 837个。发现实心竹17 340个差异基因,富集到生物学过程(Biological process)10 851个,细胞组成(Cellular component)4 723个,分子功能(Molecular functiom)15 846个。发现火筒竹13 896个差异基因,富集到生物学过程(Biological process)8 718个,细胞组成(Cellular component)3 959个,分子功能(Molecular functiom)12 737个基因。不同的种质、不同的条目(GO terms),GO富集的基因数量差异,反应了基因的功能保守性。(6)KEGG Pathway:厚壁毛竹差异基因涉及116条代谢通路,1 210个基因;实肚竹差异基因涉及到119条代谢途径,3 470个基因;实心竹差异基因涉及到119条代谢途径,3 474个基因;火筒竹差异基因涉及到118条代谢途径,3045个基因。重点分析了厚壁毛竹氨基酸12条代谢通路,发现PH01000648G0610等151个基因发生了改变。涉及到淀粉、糖类、激素,和在核糖体、内质网等糖、蛋白、脂类等细胞基本物质的合成、转运等,反应了厚壁毛竹种质性状形成的代谢通路特征。(7)通过厚壁毛竹、实肚竹、实心竹的“厚壁”,火筒竹的“薄壁”材料的比较基因组研究与分析,获得的厚壁候选基因集包含了3 165个基因,GO富集到生物学过程2 411个基因,细胞组成1 180个基因,分子功能2 943个基因。发现PH01001643G0420等633个基因能够匹配到已知的代谢通路上,重点分析了能量、元素、氨基酸等的部分代谢途径,发现了一批因SNP、In Del引起的氨基酸密码子的改变,其与厚壁毛竹种质性状的直接或显著相关性有待验证。