基于改进选择性视觉注意模型的语义图像分割研究

被引量 : 0次 | 上传用户:suny112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动语义图像分割是计算机视觉领域中一个非常具有挑战性的课题,它是迈向图像理解的关键步骤。然而,用户对图像的理解或检索无法用图像处理算法提取的底层图像特征来完全表达。因此,图像分割与检索等技术面临的严峻问题之一是底层图像特征与高层语义之间存在的巨大语义鸿沟。选择性视觉注意模型(SVAM)是为拟合人类视觉注意机制而提出的可计算模型,它能获得图像中最容易引起人们注意的显著区域,从而能更好地进行语义图像分割。另一方面,作为第3代人工神经网络主要代表的脉冲耦合神经网络(PCNN)在图像分割方面也有良好的性能。为了进一步提高语义图像分割的准确性,本文研究SVAM+PCNN整合模型的自动语义图像分割模型或方法。主要研究内容和结论如下:(1)针对PCNN分割输出为二值图像,而选择性视觉注意模型显著性检测输出为灰度显著图,二者难以直接进行公平比较的问题,采用二者最终彩色图像分割结果灰度化方法,然后对二者的灰度图像分割结果进行受试者工作特征(ROC)曲线分析,来达到二者语义图像分割结果公平比较、分析的目的。实验结果表明,改进ROC分析方法能够有效评价与分析不同类型的图像分割模型或方法。针对整合模型与其组成模型之间性能评价的常用数字化指标差异不大时,缺少评价改进效果或显著性差异的评判标准问题,本文提出把统计学上的均方差指标、双侧Student’s t-test假设检验方法引入模型间的显著性差异分析上。实验结果表明,该指标和方法能够有效评价图像分割模型或方法。(2)针对STB/Itti选择性视觉注意模型提取出的感兴趣区域过小,难以有效进行语义图像分割的问题,提出STB/Itti+PCNN整合模型。该整合模型以STB/Itti模型提取出的颜色与方向特征融合图作为PCNN的输入图像,以增强PCNN的全局耦合功能与抗噪性;用STB/Itti模型的显著图确定出PCNN应点火神经元范围,PCNN无需多次迭代寻找该范围;并且用PCNN取代STB/Itti模型中的WTA神经网络来进行图像分割结果输出。另外,针对缺乏迭代过程的PCNN其图像分割能力会有所下降的问题,用STB/Itti模型的特征融合图输入和局部迭代归一化合并策略来保持或增强PCNN的图像分割能力。实验结果表明,STB/Itti+PCNN整合模型能够有效进行语义图像分割,平均AUC值比STB/Itti模型提高了127.94%,与STB/Itti模型的显著性差异概率在0.99以上,且具有很强的抵抗噪声污染和几何变换攻击的能力。(3)为了科学评价语义图像分割效果,在本研究语义图像分割实验及分析文献的基础上,提出8项最佳语义图像分割标准:1)基于一定的生物视觉机制;2)不需任何已知样本训练与可调参数;3)首先关注的是最大的显著区域;4)平滑地囊括显著目标整体;5)分割出的显著目标具良好的形状特征;6)能抵抗噪声污染和几何变换攻击;7)实时地输出全分辨率图像分割结果图;8)可硬件实现。并用这些标准来指导本研究的语义图像分割模型的设计、建立与实现。(4)为获得最佳语义图像分割结果,本文按照从粗分割到细分割的思想,提出能获得最佳语义图像分割效果的GBVS+PCNN整合模型。在对9种现有SVAM进行视觉效果、性能指标及平均耗时研究对比后,选择GBVS进行语义图像的粗分割,用GBVS提取出的亮度特征图作为PCNN的特殊输入图像,并用该PCNN来扩展GBVS进行语义图像的细分割;最后,用提出的基于“AUC值大小”判决准则的显著区域判别算法,自动完成最终语义图像分割结果的输出。实验结果表明,GBVS+PCNN整合模型能满足前7项最佳语义图像分割标准;该整合模型的PCNN扩展部分则满足全部最佳语义图像分割标准。运用双侧Student’s t-test方法,得出该整合模型与GBVS之间的显著性差异概率在0.99以上。(5)针对PQFT模型提取出的显著图中冗余低频信息过多,导致不能很好界定显著目标物位置的问题,本文通过PCNN模型自动设置的链接系数来确定出每个像素的周边区域,提出一种拟合生物视觉神经元的中央兴奋-周边抑制机制的精简C-S运算方法,用该运算方法计算出的CIE Lab颜色空间上三通道差值图像作为PQFT的4元数输入图像的虚部系数,从而得到改进PQFT模型:IPQFT,以有效减少显著图中的冗余低频信息。另外,针对基于“AUC值大小”判决准则的显著区域自动判别算法在其整合模型中的平均耗时占到5%过多的问题,提出与其功能相似的基于“尺寸变化与否”判决准则的显著区域判别算法,在MATLBAB环境下使显著区域判别算法对测试图像的平均耗时从102.0ms降到了16.1ms。(6)针对可硬件实现的实时语义图像分割实际应用需求,提出IPQFT+PCNN整合模型。用IPQFT进行语义图像的粗分割;用PCNN对IPQFT扩展并进行语义图像的细分割;用基于“尺寸变化与否”判决准则的显著区域判别算法来自动完成最终语义图像分割。实验结果表明,在MATLBAB环境下IPQFT+PCNN整合模型处理一幅测试图像的平均耗时为238.2ms,达到了实时性的要求;由于IPQFT中的主要算法傅里叶变换及PCNN均可硬件实现,二者的整合模型也便于硬件实现;另外,该整合模型具有抗噪性、几何不变性等健壮的鲁棒性,同时还具有并行、自动、智能等特点。(7)针对语义图像分割模型或方法的性能数字化指标综合评价方法尚不完善问题,遵照最佳语义图像分割标准,提出一种不同类型SVAM的综合评分决策表的方法,以丰富SVAM的评价方法与指标体系。从综合得分情况看,本文提出的3种整合模型在语义图像分割方面均优于本研究中现有的9种SVAM,能够显著提高语义图像分割的准确性。
其他文献
独生子女家庭作为我国上世纪70年代进行人口控制以来产生的一种生育事实,使我国顺利通过了人口数量众多的压力考验,并在-定时期创造了“人口红利”的良好局面。这些家庭承担
近年来移动机器人技术飞速发展,很多种类的移动机器人开始应用到实际中。爬壁机器人作为移动机器人领域的一个重要分支,把地面移动机器人技术与吸附技术有机结合起来,大大扩
论述旋转机械松动造成机组振动的故障原因和故障特征,通过对一台风机机组的电机基础松动故障的成功诊断实例介绍,论证了根据故障特征判断机械松动故障方法的有效性。
“教”与“玩”结合是小学体育教学的有效方法。其依据:小学生的情趣特点、身体素质、接受能力、成长需求。基本方法:集分结合、课间穿插、命题发挥、内外联系。原则要求:服
红豆杉是珍稀药用裸子植物,其内含物紫杉醇对癌症有显著治疗效果,实现工业化生产紫杉醇是解决紫杉醇药源需求的最佳途径。利用红豆杉组织培养技术,在人工环境中对红豆杉组织
水墨人物画写实造型研究是一个具体而又宽泛的问题,它涉及传统人物画中“形神”造型观的辩证发展,也涉及20世纪水墨人物画的写实性发展。20世纪初至文革前,水墨人物画的变革在内
随着社会老龄化的加快,腰椎退行性疾病逐渐成为干扰人们健康和生活质量的常见疾病。腰椎退行性疾病既是一种机体自然退变的进程,也是自身保护的一个机制,随着病程的进展,逐渐
针对风机叶轮侧轴承座水平振幅异常、噪音大的问题,对风机运行进行检测,并分析其振动异常的原因。经过分析得出:零部件机械松动带来的摩擦和剐蹭使轴承在转动过程中产生不均
《孝经》是一部宣扬孝道的儒家典籍,其影响了中国两千年的历史。《孝经》是儒家经典之一,曾对中国文化和中国社会产生过广泛、深刻的影响。自《孝经》出现这两千年来,研究《
目的分析肺癌脑转移的立体定向放疗(Stereotactic Radiotherapy, SRT)疗效和预后因素。方法回顾分析行SRT的152例肺癌脑转移病例。SRT组59例,联合SRT+全脑放疗(whole brain r