论文部分内容阅读
动物线粒体基因组中13个呼吸相关的蛋白编码基因,是目前动物系统和进化研究中最常用的分子标记。随着新一代测序技术的迅速发展,大量动物线粒体基因组已被测出,在昆虫纲(Insecta)中,鳞翅目(Lepidoptera)、双翅目(Diptera)及膜翅目(Hymenoptera)昆虫线粒体基因组密码子偏好性方面的研究已经陆续展开了,直翅目(Orthoptera)作为古老昆虫类群之一,全线粒体基因组已经被测序的物种有2个亚目,7个总科,77个物种。本文在融合生物信息学研究方法的基础上,使用大量生物学软件,将直翅目昆虫线粒体基因组和密码子偏好性相结合,旨在深度挖掘直翅目昆虫线粒体基因组中隐含的进化信息。论文首先分析直翅目昆虫线粒体基因组密码子偏好性特征;其次重点探究导致其偏好性的主要原因;最后基于13个蛋白质编码序列(13CDs)的相对同义密码子使用度(RSCU)做层次聚类分析,并将其与基于13CDs分别使用贝叶斯法(BI)、最大似然法(ML)和最大简约法(MP)构建的三种系统发育树结果做比较分析,两者结合以探讨不同方法对直翅目各物种的聚类情况,判断基于RSCU值的层次聚类在重建直翅目内部进化关系方面的有效性,并分析密码子偏好性与直翅目物种亲缘关系之间的相互关系。具体结论如下:1.77种直翅目昆虫线粒体基因组的有效密码子数(ENC)范围为33.10~51.25,其中蝗亚目ENC平均值为36.86,接近35;螽亚目ENC平均值为42.57,由此说明直翅目昆虫线粒体基因组密码子偏好性总体为一般偏好性,但是蝗亚目和螽亚目之间偏好性差别比较大;相比较蝗亚目偏好性更强,而螽亚目偏好性相对较弱。77种直翅目昆虫线粒体全基因组的13CDs密码子RSCU值揭示出直翅目昆虫线粒体基因组对62个密码子的使用频率不一样,具体表现在:使用频率比较高的密码子,RSCU值较大;而使用频率很低的密码子,RSCU值小。根据高频密码子定义,综合分析77个直翅目昆虫线粒体基因组RSCU值,发现在编码氨基酸时,共有26个高频密码子,被经常使用,这些密码子均偏好以A或者T结尾,而有7个密码子几乎不被使用,均倾向以C或G结尾。另外,对不同亚目的不同总科物种来说,同一密码子的RSCU值也存在差别的地方。因此,直翅目昆虫线粒体全基因组在密码子使用上,总体上存在一般偏好性,且偏爱以A或者T结尾的密码子,避免使用以G或C结尾的密码子。2.中性绘图分析和ENC绘图分析结果结合表明:选择作用在导致直翅目昆虫线粒体密码子偏好性中起主导作用,而突变的作用是次要的。另外密码子三个位点A、T、G和C组成分析以及氨基酸组成分析显示碱基组成偏好和氨基酸偏好对直翅目密码子的偏好也存在影响,主成分分析(PCA)和相关性分析(COA)揭示基因表达水平及氨基酸亲疏水性和芳香性对直翅目昆虫线粒体基因组密码子偏好性的形成有重要的影响,基因长度对其的影响略小。密码子与反密码子之间相互作用的研究显示,转运RNA (tRNA)丰度对该目线粒体基因组密码子使用偏好性的形成几乎不起作用。3.进化分析:基于13CDs的同义密码子RSCU值的层次聚类分析,与基于13CDs构建的BI、ML和MP三种系统发育树,结合分析表明,基于密码子RSCU值的层次聚类分析可以在一定程度上反映物种进化关系,亲缘关系越近的物种,倾向于具有越相似的密码子的使用模式。因此,基于密码子偏好性的聚类分析可以作为进化分析的一种参考方法。本研究可以帮助我们更好地了解直翅目昆虫线粒体基因组密码子偏好性特征,为探究直翅目进化问题提供一个新的视角,同时可以为昆虫纲不同目密码子偏好性之间的比较研究提供一定的参考价值。