论文部分内容阅读
蛋白质亚细胞定位是分子细胞生物学和蛋白质组学的一个重要研究课题。蛋白质在核糖体内合成之后必须被转运到特定的亚细胞器官,才能发挥其生物学功能,使整个生命机体正常运转。蛋白质的亚细胞定位与其功能密切相关。因此,研究蛋白质的亚细胞定位,有助于了解蛋白质的性能和功能。自动的荧光显微镜技术是目前在光镜水平对特异蛋白质等生物大分子定性定位研究的最有利手段之一,允许蛋白质定位以高通量荧光成像。因此,我们需要一个自动高效的方法能够对亚细胞图像进行量化、区分和分类,关键点在于图像特征的提取以及分类算法的设计。本文主要围绕这一主题,针对蛋白质亚细胞图像的特征提取方法和分类预测算法两方而进行了研究,并在不同的数据集上分别进行了测试和分析。本文的主要创新工作概况如下:本文提出了一种新的蛋白质亚细胞图像提取算法,该算法基于图像局部不变特征,且具有旋转和平移不变性。主要思想是:首先是选取一个阈值对图像进行预处理,小于该闽值的像素点像素值统一置为零,大于或等于阈值的像素点的像素值保持不变,这样我们把图像分割为背景部分和目标部分,在尽量不损失图像信息的情况下,减少特征提取工作量,提高算法效率:其次,对目标区域中的每个像素点,计算其与周围8个像素点的差值,若领域灰度值较小的标记该领域点为0,其余的则标记为1,这样会得到一个邻域二值模型,对该模型进行求和运算(即统计1的个数),其值范围为0-8,这样每幅图像的像素点可归为0-8共9组:最后,对每幅图像,统计其每组像素点的个数,然后再根据邻域差值模型,分别计算出每组像素点的正负差值之和以及差值绝对值的方差,这样每组可计算得到4个统计量,每幅图像我们可以得到9×4=36组特征量。在本文中,我们采用了支持向量机算法作为预测分类工具,在LOCATE Endogenous、LOCATE Transfected和2D HeLa三个不同的蛋白质亚细胞图像集上进行了测试,分类正确率分别为96.7%、92.3%和902%。由结果可知,本文的方法取得了较好的预测效果,与其他方法相比,也具有明显的优势。