论文部分内容阅读
基因序列的相似性研究是生物信息学研究的热门问题之一.随着人类基因组计划的相续完成,大量的基因序列被相续测序,蛋白质序列的相似性研究变得越来越复杂。工作量越来越大.因此,研究新的序列比对方法便成了迫切的问题.而基因序列的图形表示方法则是研究基因序列相似性的一种行之有效的方法.
本文的主要工作包括以下几个方面:
1、在DNA序列的混沌游走方法(CGR)及DNA序列的4线图谱表达方法(4-LGR)的基础上,提出了一种新型DNA序列的表达方法-矩阵图谱表达法(MGR).进一步,在DNA序列的上述三种表达式基础上,分别建立了基于经典HP模型的蛋白质序列的图谱表达法,而且对蛋白质序列的相似性进行了比较验证.
2、基于经典HP模型下,利用蛋白质序列的矩阵图谱表达法(MGR)及数值刻划的思想提出了一种新的蛋白质序列的比对方法.通过观察蛋白质序列的数值刻划图及计算两蛋白质序列之间的欧氏距离d,对木聚糖酶两家族的蛋白质序列进行了相似性分析.
3、在石秀凡及朱平等人提出的拟氨基酸编码方法的基础上,计算了F/10和G/11木聚糖酶家族的同义密码子的二个相对使用度,即RSCU和QRSCU通过分析和比较得到,基于拟氨基酸的编码方法能更明显的展示出密码子家族中对同义密码子的一致偏好性.也就是说,基于拟氨基酸编码方法下的F/10与G/11木聚糖酶家族更偏好使用密码子-反密码子结合作用强的密码子,恰好是以g/c结尾的密码子.这些结果与前人的偏好性研究结果一致,并且我们进一步验证了拟氨基酸的编码方法与密码子偏好性的研究结果密切相关.
4、本文采用Jeffrey于1990年提出的描绘DNA序列的混沌游走方法(CGR)给出了F/10及G/11木聚糖酶家族的核酸序列的CGR图,计算了相应的马尔可夫两步转移概率,进而计算了F/10和G/11家族同义密码子的偏好使用度.通过以上分析得出的结论是。碱基的偏好使用情况与序列的G/C含量和分子进化成正相关性.
文中的研究结果表明,上述的研究是有意义的,其具有实用价值,对今后的这一方面的研究具有极大的帮助.