基于细节空间关系信息的视觉特征表达及图像分类应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:tian314714
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,图像分类已成为计算机视觉与模式识别领域的重要研究内容,在实际情况中也有着十分广泛的应用。图像分类方法通过提取图像的关键特征,对图像进行自动识别与理解,为很多现实问题提供了有效的解决方案。视觉特征的提取与表达是图像分类算法中最基础也是最关键的环节,有效的特征表达方法能够减轻对后续机器学习算法的依赖性,同时也制约着整个分类系统的性能表现。图像中存在丰富的空间关系信息,对这些空间关系信息的刻画能够有效地跨越或缩小底层视觉特征与高层语义之间的“语义鸿沟”,对于提升图像分类的性能具有重要的意义。目前已有不少研究工作关注图像的空间关系信息描述,在一些医疗影像等特殊的应用背景下,图像特征基元之间的空间关系可能会异常复杂,细节空间关系可能和语义直接关联,失之毫厘谬以千里。现有相关研究中对空间关系的刻画难以满足上述需要。针对此,本文围绕图像的空间关系信息进行细致化的描述,基于这些细节空间关系信息对图像进行有效的特征表达,进一步提升图像分类精度,并结合医学、场景、遥感等多个领域数据展开研究。本文的主要工作和贡献总结如下:(1)提出了一种新的拓扑关系模型DTString。现有大多数空间关系模型表示较为简单,基本关系数目有限,丢失了大量的空间关系细节信息,与视觉特征表达的实际需求仍然存在一定的差距。本文提出的DTString模型基于字符串描述的方法,实现了对图像区域之间拓扑关系细节的精细刻画。本文证明了DTString是一种原子拓扑关系模型,即DTString所描述的拓扑关系是不可再分的拓扑关系,具有完备的拓扑关系表达能力,我们称DTString为精细拓扑关系模型。此外,本文还提出基于DTString模型的推理算法,这些推理算法使得逆关系、子区域等拓扑属性可以由DTString字符串直接推理获得,而不需要繁复的几何计算,为后续高效的相似性度量提供了基础。(2)提出了基于精细拓扑关系的图像分类方法。在精细拓扑关系模型DTString的基础上,我们首先研究了完全匹配、镜像匹配、部分匹配等多种匹配模式,提出了基于拓扑关系的相似性度量方法,并应用于几何结构检索。接着,以精细拓扑关系表达方法为基础,在基于局部特征的图像分类框架中研究了子区域的正规网格和超像素两种采样方式,进而提出了基于DTString和混合子区域采样的图像分类算法。几何结构检索和场景图像分类的两组实验结果表明,所提出的DTString模型及相应的相似性度量方法能够有效地刻画图像特征基元的细节空间关系信息,并进一步提升视觉特征的判别能力。(3)针对纹理基元的局部细节空间关系进行研究,提出了面向医学图像分类的纹理描述方法SAHLBP。现有纹理描述方法主要刻画了图像反复出现的局部模式,但是忽略了局部模式之间的细节空间关系信息。这些局部细节空间关系信息,对于区分复杂的、尤其注重细节的数据,比如医学图像,具有重要的意义。针对此,本文以局部二值模式方法为基础,对纹理基元的局部细节空间关系进行刻画。首先提出一种自适应邻域半径搜索算法确定纹理基元,进而提出一种邻近空间直方图策略来刻画纹理基元的局部细节空间关系,由此产生新的SAHLBP纹理描述方法。与现有方法相比,SAHLBP具有两个显著优点:一是能够有效地刻画纹理基元之间的局部空间关联信息,具有更强的纹理描述性能;二是具有尺度不变性,即对尺度和分辨率变化不敏感。最后,本文将所提出的基于SAHLBP的图像分类框架应用于医学图像分类,在四个真实的医学数据集中获得优异的实验结果,并验证了不同参数、不同分类器和不同分类框架对医学图像分类性能的影响。(4)针对局部特征之间的空间关系进行研究,提出一种新的空间视觉编码方法。现有方法主要通过建立固定的空间结构模板或者划分空间象限,统计落入模板中的局部特征作为空间关系特征,存在特征表达方式简单、判别力不足等问题。针对此,本文在视觉词袋模型中考虑局部特征的方向、共生、距离等多种空间关系,对视觉特征进行有效的空间编码,并通过学习的方式挖掘深层的空间关系模式。首先基于距离和频繁度定义了相关关键点的选择方法,进而提出一种新的结构特征来刻画相关关键点的空间关系模式和类别属性信息,并学习一种结构词袋模型作为一种图像中间层特征,实现了图像的结构化特征表达。最后,提出结合表观视觉特征和结构化特征的图像统一表示方法,在自然场景、运动事件、遥感等四个图像数据集中验证了所提出方法的优异性能。综上所述,本文主要对图像不同特征基元之间空间关系信息的特征表达进行了深入研究,提出了相应的算法。实验结果表明对图像的空间关系信息进行细致化的表达,可以有效地增强视觉特征的判别能力,从而进一步提升图像分类的性能。
其他文献
通过对公乌素煤矿煤层自燃防治情况的分析,结合矿井原有防灭火系统,确定在矿区南、北两翼分别建立地表注浆站;充分考虑矿井井下生产条件,优化设计注浆系统,计算确定注浆参数;
无视野重叠区域的跨摄像机行人跟踪是指运用计算机视觉、模式识别和机器学习等技术,在无视野重叠区域的不同摄像机间对相同行人进行检测、跟踪和再识别,从而实现对行人进行长
《边坡与基坑工程》是一门实践性、应用性很强的专业课程,同时也是土木工程专业岩土工程方向的核心课程.但是,目前该课程的教学中存在教材匹配度欠佳、课时安排欠合理、教学
通过对DF型内燃机车燃油系统原理和典型故障现象进行分析,找出发生故障的原因,并提出了相应的解决措施和检查步骤,降低了DF型内燃机车燃油系统故障发生的频次。 By analyzin
计算机层析成像(Computed Tomography,CT)作为一种先进的检测技术,以图像形式直观清晰地反映被测对象内部结构和性状,在医学诊断和工业无损检测领域的应用十分广泛。随着CT技
机器学习是人工智能的重要研宄课题之一,而分类和聚类是机器学习中的两个重要的研究课题,已广泛应用于自然语言处理、生物特征识别、计算机视觉、语音识别和图像识别等领域。
随着我国融入经济全球化的步伐加快,《国际贸易理论与政策》课程教学也由过去以批判西方理论为主,转为在全面、客观地介绍西方理论的基础上,探索建立适合于我国社会主义初级
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
特长山岭隧道施工方法论析之二西南交通大学唐经世掘进机法与钻爆法修筑秦岭铁路隧道技术经济比较参考如表1。表正表2大直径TBM在铁路山岭隧道使用情况注1—掘进机法要招标、制造、
介绍新型煤矿注浆系统在赵固二矿防治水中的应用。该矿采用地质体注浆改造系统对太灰、奥灰含水层进行注浆充填,封堵透水裂隙,把含水层改造成弱含水层或隔水层。系统采用水泥