论文部分内容阅读
大花香水月季(Rosa odorata var.gigantea)属蔷薇科蔷薇属的落叶灌木,也称巨花蔷薇,为所有蔷薇属野生种中开花最大者,具有芳香、大花、耐低温等优良园艺性状,为香水月季原始亲本类型之一,是培育蔷薇科大花品种的重要种质资源。本文通过分析大花香水月季基因组密码子使用偏性,探讨影响密码子偏性形成的主要因素,了解密码子用法,为之后对外源基因进行改造,提高以大花香水月季为目的宿主的外源基因的表达效率提供参考。以大花香水月季叶绿体基因组为研究对象,利用codonW等软件进行统计分析,对该基因组的密码子使用与基因的表达高低、CDS区的碱基组成作了系统分析,结合相对同义密码子使用度、中性绘图、ENC绘图、对应性分析及PR2-plot等方法分析该基因组密码子的使用偏性。并且通过对高频密码子及高表达密码子的分析,鉴定大花香水月季叶绿体基因组的最优密码子。结果表明:大花香水月季叶绿体基因组序列来源于NCBI数据库,GenBank登录号为KF753637.1。序列全长为156 634 bp,其GC含量约为37.22%,其中GC3含量为29.46%,明显低于GC1(26.26%)和GC2(39.97%),即第3位密码子富含A和T。根据其注释信息可知该叶绿体基因组共包含88条基因编码序列,占全长的50.92%,剔除其中30条长度小于300 bp及非3整数倍的序列和4条重复基因序列,剩余54条序列用于本研究各项分析。相对同义密码子使用度分析显示RSCU值大于1的密码子有30个,其中除TTG外,其余29个密码子均以A或T结尾。中性绘图分析显示GCl2与GC3的相关系数为0.141,相关性不显著,回归系数为0.1961,说明密码子第1、2位与第3位碱基组成变异无明显关联。ENC绘图分析显示,基因组中仅少量基因沿期望值曲线分布或落在期望值曲线附近,偏性较弱,而多数基因则分布于期望值曲线的下方,偏性较强。基于RSCU的对应性分析表明,第一轴能够解释基因总变异的10.35%,第一轴与CAI、CBI呈负显著相关,说明CAI与CBI对大花香水月季叶绿体密码子的偏性有较大影响,其他因素对其偏性也有一定影响,其使用偏性形成过程较为复杂。PR2-plot分析显示,密码子第3位碱基的使用存在偏性,嘧啶比嘌呤使用更为频繁,即T的使用频率高于A,C的使用频率高于G。综合以上几项分析发现,大花香水月季叶绿体基因组密码子的使用受突变影响较弱,更多地受到如选择压力等其他因素的影响。最终结合高频密码子和高表达优越密码子,将同时确定为两者的密码子定义为大花香水月季叶绿体基因组的最优密码子,即TTT、CTT、TCA、ACA、TAT、TAA、CAT、AAT、GAT、TGT、CGA、AGT和GCA等13个,并且均以A或T结尾,其中8个以T结尾,5个以A结尾。