论文部分内容阅读
【目的】通过试验获得茶树CHS基因(CsCHS)gDNA序列,以进一步确定CsCHS基因结构;研究CsCHS编码区单核苷酸多态性,并结合茶树多酚含量进行关联分析,寻找基因中可能存在的与茶多酚含量存在显著或极显著相关关系的SNP位点。【方法】根据NCBI数据库中已有CsCHS序列设计特异性引物,再分别以基因组DNA和cDNA为模板进行PCR扩增,经克隆、测序获得CsCHS1、CsCHS2、CsCHS3三个基因的gDNA和cDNA全长序列,通过序列比对方法确定CsCHS结构。利用Compute pI/Mw、SOPMA等软件对所得序列进行生物信息学分析,预测和比较CsCHS1、CsCHS2和CsCHS3三者蛋白质结构。以茶多酚含量差异较大的57份茶树品种为材料,分别以57份材料的cDNA为模板,用特异性引物进行PCR扩增,然后利用PCR产物直接测序法筛查CsCHS编码区序列的单核苷酸多态性。结合CsCHS编码区序列单核苷酸多态性和57份材料多酚含量,利用软件TASSEL进行关联分析,筛选基因中可能与茶多酚含量存在显著或极显著相关关系的SNP位点。【结果】试验获得CsCHS1、CsCHS2和CsCHS3的cDNA序列长度分别为1 277、1 320和1 242 bp,各自均包含一个长度为1 170 bp的开放阅读框;CsCHS1、CsCHS2和CsCHS3的gDNA序列长度分别为1 600、1 330和1 607 bp。通过gDNA序列和cDAN序列比对,结合真核生物内含子GT-AG法则,确定CsCHS1、CsCHS3分别包含2个外显子和1个内含子,内含子大小分别为323和356 bp,CsCHS2可能没有内含子。根据CsCHS1、CsCHS2和CsCHS3 cDNA序列推导三者对应氨基酸序列,比较三条氨基酸序列发现三者氨基酸同源性较高,达到92.6%—95.4%,CHS蛋白亚家族中的特征性保守位点在这三条序列中都能找到,生物信息学分析结果显示CsCHS1、CsCHS2和CsCHS3三者蛋白质结构高度相似。CsCHS1编码区序列中共发现71个SNP位点,SNP出现频率为1SNP/16.48 bp,无Indel,基因核苷酸多样性(π)值为0.01088;CsCHS2编码区序列中共发现55个SNP位点,SNP出现频率分别为1SNP/21.27 bp,CsCHS2核苷酸多样性(π)值(0.00530)明显低于CsCHS1;因扩增CsCHS3 cDNA序列的PCR反应成功率低,未对该基因遗传多样性进行分析。通过关联分析分别从CsCHS1和CsCHS2中找到2个和4个与茶叶多酚含量相关的SNP位点。【结论】CsCHS1和CsCHS3属于保守型CHS基因,且CsCHS1、CsCHS2和CsCHS3蛋白质结构高度相似,推测三者可能在茶树的不同部位或不同生长阶段发挥类似作用;CsCHS1和CsCHS2活跃,二者编码区内可能存在突变热点区。