论文部分内容阅读
本文内容主要涉及两方面:一方面是生物序列的图形表示,包括DNA序列的二维图形表示和四维图形表示以及RNA二级结构的二维图形表示;另一方面是在图形表示基础上进行的相似性分析,相似性分析用到的生物序列的数值特征有商矩阵的正规化最大特征值以及平均几何中心。
本文的主要工作包括以下几个方面:
在第二章,通过把DNA初始序列划分成一系列密码子,根据遗传密码建立映射,得到一种新型的非退化的二维图形表示。利用序列对应点的坐标构造商矩阵,以商矩阵的正规化最大特征值作为序列数值特征,进而对11种物种的β球蛋白基因的第一个外显子序列进行相似性分析。得到的相似性矩阵是合理的,并且有一定进步。
在第三章,改进了已有的四维图形表示。利用DNA分子中的四种碱基A、G、C和T的化学结构分类,给出了DNA序列的一种新的四维图形表示方法。在图形表示基础上构造平均几何中心作为序列的数值特征,并利用数值特征给出了两种度量DNA序列相似性的方法。
在第四章,用二进制码来表示RNA二级结构的特征序列中的碱基,把RNA初始序列转化成二进制编码序列,进一步构造映射并以‘worm’曲线为模板给出了RNA二级结构的二维图形表示。利用图形表示上对应点的坐标构造商矩阵,以商矩阵的正规化最大特征值作为二级结构的数值特征,并对9种病毒的二级结构进行相似性分析。