论文部分内容阅读
双向凝胶电泳技术作为一种核心蛋白质分析工具,伴随着蛋白质组学的不断发展而焕发着新的活力,对于推动蛋白质组学的发展发挥了极其重要的作用。它主要以凝胶为载体,根据蛋白质等电点和相对分子量的不同在凝胶介质的二维空间上实现蛋白质的点状分离。双向凝胶电泳图像的分析系统由凝胶图像采集、凝胶图像处理和凝胶图像蛋白表达差异评估三个模块组成。由于数据量极其庞大,凝胶图像分析(包括图像预处理,蛋白点检测与分割和蛋白点匹配等)必须借助计算机分析来完成,使得基于计算机的凝胶图像分析成为蛋白质组学的分析的关键一步。其中只有在图像分割成功的基础上才有可能实现对目标特征的提取和参数的测量,使更高层图像的分析和图像理解成为可能。有效的分割方法可以减少蛋白点的过分割和欠分割,最大限度的将所需特征区域提取出来;可以有效区分交叉蛋白质点,提高蛋白质点确定的可靠性和点匹配结果的可信度;还可以快速准确的估计蛋白质点的有用信息(蛋白质点的灰度、体积等),进一步提高蛋白点的差异分析,实现凝胶图像的生物标记。马尔可夫随机场(Markov random field, MRF)方法是建立在马尔科夫随机场模型与贝叶斯(Bayes)理论的基础上,提供了先验知识与不确定性描述联系的纽带,并根据观测图像的特点,利用估计理论和统计决策中某些最优准则确定分割问题的目标函数,以此来求解满足这些条件的最大可能分布,从而将分割问题转化为最优化问题。本文主要是在传统分割算法的基础上,对基于马尔科夫随机场的凝胶电泳图像分割技术进行研究。传统分割算法中,基于阈值分割算法的概念相对简单,计算效率较高,对于目标与背景对比较强的图像有良好的处理方法,但是它对灰度依赖性较强;基于区域分割算法能够考虑到图像的空间关系,但偏重于区域的整体属性,容易导致图像的边界分割不理想,并且由于它本身属于一种迭代算法,对空间和时间的耗费相对较大;基于边缘检测分割算法,虽然对于边缘定位精度、检测精度和边界的确定都有很好的分割效果,但对噪声敏感,且不同的算法边缘检测结果的精度也没有一个标准统一的衡量尺度;除此之外分水岭算法因其计算速度快对边缘定位准确而被引入到凝胶图像分割上来,但其过分割现象的出现依然作为一个难点存在。而基于Markov随机场的分割方法是一种利用图像像素空间相关性进行分割的方法,它将图像的灰度信息进行分类,并且能够准确的描述每个像素所属分类与周围像素类别之间的相互依赖关系。本文提出了一种基于改进Markov随机场的凝胶图像分割算法,其首先利用非局部均值(NL-means)对图像进行滤波实现图像预处理,然后根据贝叶斯定理实现图像的分割,该过程中通过了一个二阶逻辑模型(MLL)模糊聚类作为先验知识获取其先验概率并因此得到后验概率,并引入了灰度点密度权值来实现聚类和均值方差的改进更新,最终实现凝胶图像的最优化分割。仿真结果表明,改进算法明显优于基于原始Markov随机场的分割方法,它在一定程度上解决了微弱蛋白点和交叉蛋白点的检测与分割,进一步提高了凝胶图像分割的准确性。