论文部分内容阅读
蛋白质组学是后基因时代研究内容的重要组成部分,双向凝胶电泳技术作为蛋白质组学的核心技术,对于蛋白质组学的发展具有重要的意义。根据蛋白质点的等电点和相对分子量的不同把蛋白质从一块凝胶上以点状的形式分离开来的所得到的图像就是双向凝胶电泳图像。因为一块凝胶上的蛋白质点的数量非常庞大,所以基于计算机的蛋白质凝胶图像分析对于蛋白质组学的分析具有重要意义。凝胶图像的计算机分析主要由图像预处理、蛋白质点的检测和定量、凝胶匹配等组成,其中蛋白质的匹配是凝胶图像分析的重要内容。在得到双向凝胶电泳图像之后,首先根据蛋白质点在相应区域内的分布情况,对蛋白质点的结构和特征变换进行比照,找出差异蛋白质点;然后再对这些差异蛋白质点进行分析,为下一步的药物研发、疾病诊断及环境检测提供数据基础。图像配准技术使得差异蛋白质点可以快速而准确的被提取出来,从而为蛋白质的分析提供了保证。本文以凝胶电泳图像蛋白点为研究对象,对凝胶图像的配准技术进行了研究,主要研究工作和成果如下:(1)对凝胶图像蛋白质点配准的相关理论基础知识进行了系统研究,详细阐述了图像配准过程中的一些基本知识,即图像变换的类型、图像配准的基本流程和图像配准的分类等相关知识。(2)研究了基于互信息的图像配准算法和基于Harris算子的图像配准算法。通过比较分析发现,基于互信息的图像配准算法可以实现自动配准,配准精度高。但是这种方法在计算互信息时需要所有的像素点都参与,而且每一次优化搜索都要计算一次互信息,所以这种方法的计算量比较大,配准速度慢。虽然基于Harris算子的图像配准算法实现简单,配准速度快,但是由于在特征点检测时所设定阈值的大小,容易发生丢失特征点信息或者出现伪特征点的现象。(3)结合基于互信息的图像配准方法和基于Harris算子的图像配准方法这两种方法的特点,对基于SURF特征的图像配准算法进行了研究。一方面减少了计算量,提高了配准速度,另一方面不会像基于Harris算子的图像配准算法那样出现伪特征点,提高了配准效率。但是由于基于SURF特征的图像配准算法在计算Hessian矩阵时得到的特征点的响应偏小,所以提取的特征点比较少,使得配准效率降低。针对这一问题,改进的SURF算法在检测SURF的特征点时对近似的Hessian矩阵行列式做了加权处理,在增加匹配点对数的同时减少了误匹配点。基于SURF特征的图像配准算法在特征点匹配是用欧氏距离作为相似度量,计算量大,配准速度慢。改进后的SURF算法,在特征点匹配时,用曼哈顿距离代替欧式距离作为相似性度量来计算两个特征向量之间的距离,降低了配准的复杂度,提高了配准速度。同时对曼哈顿距离进行加权处理,确保了配准的鲁棒性。