图像分析与理解的模型方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:jinhe_ieka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分析与图像理解都是以数学分析为基础,利用计算机处理图像,完成某些任务,只是前者侧重于对图像中感兴趣区域的分割、检测等操作;而后者侧重于获取图像中的知识,对图像进行理解和解释,这些都是当前计算机领域的研究热点和难点。图像分析和图像理解与计算机视觉、与人工智能有着密切的联系,两者都在于研究并实现具有与视觉系统感知水平相当的框架模型,因此从分析模型和方法本身入手来研究图像分析与理解过程具有重要的理论意义和应用前景,同时对模型的结构和功能的理解及其数学模型的建立是扩充和发展现有图像分析和理解方法的重要手段。   本文从图像分析与理解中的关键模型和方法入手,以视觉信息的表示、学习和理解为研究主线,重点分析了模型结构及其表示方法,结合相关视觉系统的结构和功能机理,初步研究并构建了基于若干模型方法的图像分析和理解框架,完成了图像分割、视频分类、场景识别以及目标标注等不同层次的图像分析和图像理解任务。   本文的主要工作如下:   (1)概述了图像分析与图像理解的层次结构、相互关联及其研究现状,总结了图像分析和理解的中的模型和方法,分析了采用智能模型方法进行图像分析与理解的可行性,提出了基于若干模型方法的图像分析与理解的研究框架。   (2)以图像的低层特征描述方法为基础,特别是针对图像中车辆阴影的分割问题,提出了带有目标知识约束的背景更新模型,获取了多颜色空间中阴影敏感的光谱特征,融合了多颜色空间中各通道条件随机场分割结果,构建了基于多颜色空间目标约束的图像分割模型。   (3)以Bag-of-words模型为基础,进一步研究了图像的低层视觉描述,提出了融合颜色信息的尺度不变特征转换,使得局部特征可以结合全局信息,构建了全局-局部信息视觉词汇,利朋概率隐语义分析模型对视频进行语义内容分段解析,有效的实现了高精确度的医学视频分类。   (4)以图像的中层结构信息表示方法为基础,分析了相关视觉系统场景识别模式,有效利用了全局和局部特征信息,融合了图像层次结构表示和神经网络收敛方法,依次使用生成模型和判决模型进行训练,捉山了基于多层次混合模型的广义场景识别算法,对于广义数据库和特殊数据库均有效地实现了场景识别。   (5)以高层视觉认知过程为背景,在LabelMe数据库的基础上,研究了构成目标图像块的中层语义信息,分析了图像块视觉词汇的流形分布,构建了基于流形学习特征约减的带有中层语义约束的目标标注模型,有效地实现了目标标注。
其他文献
信息化时代,垃圾邮件被认为是最有效和最廉价的广告形式,诱惑一些投机者采用这种新的途径传播信息。垃圾邮件严重干扰人们正常生活,浪费用户的时间、精力,更为严重的是造成信息安
近几年,在市场经济高速发展和汽车制造行业信息化日趋成熟的条件下,企业的生产效率得到了大幅度提高,同时也对企业产品质量提出了更高的要求,产品质量已经成为企业获取竞争优
带有隐式反馈的的协同过滤是推荐系统中最流行的方法之一。带有隐式反馈的的协同过滤可以大致分为两类:基于逐点回归和基于成对排序的方法。隐式反馈通常非常稀疏,导致基于协
无线定位技术是一种根据无线信号的各种特征参数来确定特定物体的位置坐标的技术。近年来,随着无线通信技术的发展及基于位置服务需求的不断提高,无线定位技术已被广泛应用于
为了使Web上的信息具有计算机可以理解的语义,语义网对现有的Web进行了扩展;而本体描述了其中的语义,是支持语义网实际运行的知识库,本体具体表现为领域内共同认可的概念及概
计算机软件技术、网络通信技术和微电子技术的发展,医院管理信息化、网络化的需求,推动着医学图像数字化的快速发展。医学图像数据库是建立在图像数据库、图像处理、计算机网
多协议标签交换(MPLS, Multi-protocol Label Switching)技术因具备快速转发、高质量服务、多业务支持等优势,在当前的网络中发挥越来越重要的作用。在运营商、银行、政企网
近年来,随着图像数据的爆炸式增长,图像分类在很多领域都已成为一项关键性工作,因此对图像分类方法进行研究具有十分重要的价值和意义。本文围绕图像特征的有效提取和适应于
以网络技术为主导数字语言教学系统是高校外语教学的必然趋势。研究在大学外语教学中如何全面发挥多媒体网络技术的作用,探究如何合理运用多媒体网络技术为大学外语教学改革服
传统的人工免疫系统大多建立在self─nonself识别基础上,然而self─nonself存在着天生的缺陷,例如自体集合过大,自体和非自体难以区分等。近年来兴起的危险理论很好的弥补了