论文部分内容阅读
蛋白质组学是在组织或细胞整体水平上探索蛋白质组动态变化与生理病理过程的关系,为临床诊治、新药开发和环境污染分析提供依据。二维凝胶电泳(two-dimensional gel electrophoresis,2DGE)技术是目前最有应用价值的蛋白质组分离技术。一致蛋白质斑点集检测是2DGE技术的核心内容。本文在国家自然科学基金的资助下,深入研究了2DGE图像配准和预处理方法,以及蛋白质斑点检测和匹配方法,具体的研究工作和取得的创新成果包括:(1)为了提高一致蛋白质斑点集检测的准确度,提出了基于CSIFT(classified scale-invariant feature transform)的2DGE图像配准方法。首先,提取每张2DGE图像的SIFT特征点;然后,利用透视变换模型将图像的SIFT特征点分为内点和外点两类,再利用几何相似度原理进一步将外点分为真假外点两个子类;最后,将内点和假外点作为薄板样条(thin plate spline,TPS)变换的控制点,实现2DGE图像间的弹性配准,利用同一样品多张2DGE图像之间的冗余提高CPSS检测准确度。通过对不同来源的真实2DGE图像的配准实验,验证了本文方法对缩放、旋转、噪声、光照差异和成像时的视角差异等因素具有更高的稳定性;通过对比实验,结果表明本文方法优于传统2DGE图像配准方法,配准精度高达94%以上,且无需手动输入任何参数。(2)针对脉冲噪声和人工干扰导致蛋白质斑点误检测的问题,提出了基于局部极小值分类的脉冲噪声和人工干扰去除方法。首先,采用h-极小值变换方法检测2DGE图像局部极小值;其次,利用局部极小值邻域梯度差异识别脉冲噪声和人工干扰极小值;再次,提出方向均值滤波方法重建脉冲噪声和人工干扰极小值像素;最后,通过迭代检测和重建实现脉冲噪声和人工干扰的去除。通过多组合成和真实2DGE图像的去噪实验表明,本文方法的开关滤波特性大幅度减小了对图像有用信息的损害;从m SSIM客观评价、蛋白质斑点中心极小值正确检测率和主观评价三个指标来看,本文方法综合优于现有方法;滤波前的2DGE图像蛋白质斑点中心极小值正确检测率只有66.31%,经过本文方法滤波后的正确检测率高达98.12%。针对2DGE图像整体或局部亮度差异导致蛋白质斑点量化不准确的问题,提出了邻域梯度区间直方图均衡(neighbouring grad section histogram equalization,NGSHE)的图像亮度校正方法,克服了现有亮度校正方法存在2DGE图像背景区域过度增强的问题;提出了基于背景灰度曲面拟合的背景消减方法,减少了背景不均引起的蛋白质斑点量化误差。针对高斯噪声影响蛋白质斑点边缘定位精度的问题,对比研究了多种高斯噪声滤波器用于2DGE图像的性能,通过对比实验结果和分析发现,经典高斯滤波器最适用于2DGE图像高斯噪声去除。(3)针对传统标记分水岭方法存在标记不准导致蛋白质斑点分割不准的问题,提出了一种改进的内外标记分水岭方法。首先,利用深色背景中的噪声统计规律,提出了分层检测蛋白质斑点中心极小值作为内标记的方法,提高了蛋白质斑点中心检测准确度;然后,采用灰度标记和距离标记融合的方法提取外标记,解决了距离外标记切割蛋白质斑点问题以及灰度标记相互包含的问题。通过多组检测实验表明,该方法的蛋白质斑点正确检测率大于89.10%,明显高于传统标记分水岭方法。上述改进分水岭方法对单个蛋白质斑点检测效果很好,但依然存在无法分离重度重叠蛋白质斑点的问题。因此,本文提出了一种基于山谷特征的重叠蛋白质斑点分离方法,通过提取骨架、建立拓扑结构和扫描山谷特征确定重叠蛋白质斑点的分离线。实验表明本文方法可以有效分离传统分离方法不能分离的重度重叠蛋白质斑点。(4)为了提高蛋白质斑点匹配准确度,提出了渐进式协同蛋白质斑点匹配方法。首先,采用相似度图分析方法选取蛋白质斑点的坐标特征、灰度特征和形状上下文特征;其次,对确定型蛋白质斑点进行灰度分层,在同层灰度子空间中搜索配准图像中坐标k-近邻斑点作为候选匹配点;再次,根据形状上下文特征相似度最大准则确定双向匹配结果,匹配成功的斑点作为地标点,失败的斑点加入疑似型蛋白质斑点队列;最后,基于多图、多地标点和多特征对疑似蛋白质斑点进行协同校验。实验结果表明,本文方法有效克服了传统蛋白质斑点检测和匹配方法过早使用阈值引起的漏检,蛋白质斑点的正确匹配率约为98%。上述成果已应用于本课题组开发的国内首款2DGE图像分析软件Protein Master1.1,该软件目前已经被多家公司和高校应用,取得了良好的效果。本文的研究成果为2DGE图像中一致蛋白质斑点集检测提供了新的理论和方法。