模拟人类视觉感知的行人图像显著结构的研究及应用

来源 :北京交通大学 | 被引量 : 9次 | 上传用户:zb_lion
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类在感知外界环境的过程中,80%以上的信息来自于视觉。人类视觉感知系统中,初级视皮层从眼睛接收来自外界的信息,并按照由初级到中级,再由中级向高级的顺序分级进行信息处理。点和边缘是构成图像最基本的初级视觉特征,这些初级视觉特征经过编组形成边界及区域等中级视觉特征,以区域等中级视觉特征为基础,结合构成目标的各部分之间的结构关系,最终形成完整的目标。行人图像是各类自然图像中最常见、应用范围最广的一类,面对任何一幅复杂而陌生的行人图像,人们均可迅速、准确地找出其中有用的、属于目标本身的边缘、边界以及区域等显著结构,通过对这些显著结构的研究与分析,来完成整个行人目标的解析工作。如何模拟人类的视觉感知过程让计算机代替人工完成这一系列看似简单而实际复杂的工作是计算机视觉主要解决的问题。本文借鉴生物物理学和认知心理学的相关理论,结合概率统计等数学知识对此过程进行建模,通过对行人图像中的显著点、显著边缘、显著边界、显著区域等初级与中级视觉特征的研究与分析来实现对整个行人目标的解析,并将该解析模型应用于行人目标的分割、行人行走朝向预测以及行人目标检测的再估计等高级视觉处理过程中。其中,显著点与显著边缘为属于目标轮廓或者图像中不同区域边界上的点与边缘,边缘上所包含的显著点越多,其显著性也就越强;显著边界为构成目标轮廓的边界;而显著区域则为属于目标或者前景本身的区域。本文的主要工作包括以下三个方面:1)提出了基于认知心理学中格式塔规则的行人图像显著边缘等初级视觉特征的检测方法。首先使用尺度空间边缘(Scale Space Edges, SSE)与张量投票(Tensor Voting, TV)相结合的方法对行人图像中的显著点进行检测,并根据格式塔规则中“好的形状(Good Shape)"的原理,以边缘上包含显著点的情况、边缘的长度、光滑性以及稳定性等为线索对边缘的显著性加以判断,提出一种基于边缘能量与边缘稳定性的显著边缘的检测方法;对于背景、目标内部纹理和颜色比较复杂的图像,仅从长度、光滑性等边缘本身的特征出发很难得到理想的实验结果。鉴于此,进一步提出一种基于初级与中级视觉特征的显著边缘的检测方法。通过分析各边缘两侧区域内颜色与纹理的差异,并根据格式塔规则中的“闭合性(Closure)”原理对图像中的显著边缘进行检测。上述研究成果在行人图像和不同类别的图像中均进行了验证。该方法的优点在于不仅考虑到边缘本身的特性,还综合了颜色、纹理等能直接体现区域特性的初级视觉特征,所得到的显著边缘不仅节省了存储空间,还为下一步显著边界的检测提供了线索。2)提出了一种行人图像中显著边界等中级视觉特征的检测方法。显著边缘可以为高级的目标匹配、目标识别等工作提供线索,但很难直接应用于目标的解析与分割,因此,本文以显著边缘作为线索之一,对更加连续、光滑的组成目标轮廓的显著边界进行检测与分析。首先通过改变由gPb-OWT-UCM分层分割算法得到的分层分割图的阈值,产生一组软边界,然后分别对这组边界所包含显著边缘的情况,以及其长度、光滑性等属性进行度量,并根据知觉组织中的“接近律”原则对其进行编组,检测出其中属于同一个目标整体的显著边界。分别将检测到的显著边界和真实显著边界的形状与样本库中样本的形状进行匹配。通过显著边界的检测将图像分成了不同的区域,这些区域的形状及显著性可以为更高一级的视觉处理任务提供有力线索。3)提出了基于显著区域形状的行人目标解析模型及其在高级视觉处理过程中的应用。与基于语义的解析模型不同,本文提出一种基于句法的解析模型,其基本思想是将行人分成若干可视单元,并将这些可视单元归纳为永久部分与可能部分两种类型。根据知觉的整体性原理,模拟人类视觉感知过程,以永久部分为刺激起点,引发对目标其它可能部分的联想与推测,从而感知到整个目标。具体实现方法如下:首先以gPb-OWT-UCM分层分割算法得到的分割区域为基础,保留形状较显著的区域块,然后按照行人的树形解析结构,自底向上,从单个部分的形状出发,依次考虑各个部分组合的形状,直至整个行人的形状,最终解析出整个行人目标及其各个组成部分。本文还将该解析模型很好地应用于行人目标及其各个组成部分的分割,行人行走朝向的预测,以及行人目标检测的再估计等高级视觉处理过程中,这些实验结果均验证了该模型的有效性。
其他文献
拥有超过140年历史的国际卫浴品牌美标、拥有80多年历史的高端卫浴品牌高仪、拥有100多年历史的日本卫浴品牌伊奈,这些熟悉的名字都来自骊住集团。这家全球卫浴与家装产品制
莘县1997 年开始在风沙地大面积推广春花生地膜覆盖栽培技术,1997~1999年累计推广1 万公顷。结合本地实际,通过选用良种、增加投入、培肥地力、配方施肥、提高播种质量、加强田间管理等技术措
基于生物特征识别的身份鉴别技术提供了一种高可靠性、高稳定性的身份鉴别方式。掌纹识别是一种相对较新的生物特征识别技术,但其发展非常迅速,现已成为生物特征识别技术领域
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
智能移动机器人的研究体现多学科交叉领域的综合智慧,对它的研究和应用受到国内外学者的高度关注。基于视觉的低层次匹配感知、中层次检测规划和高层次辨识理解是机器人实现
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
孩提时代,我是在水乡周庄姑妈家里渡过的。周庄是座依桥傍水的江南小镇。在那老街水巷里,最使我难忘的地方要数镇上的茶馆了。 每每姑妈下班回来,如若情趣好就会催着我们快点吃
期刊
分析和设计了一个基于Android平台的高等数学移动考试系统.该系统由服务器端和客户端两大部分构成,使用Bomb后端云存放数据库,服务器端主要包括学生信息管理、教师信息管理和
为有效保障智能楼宇管理系统可靠运行,在新的起点上推动智能楼宇管理工作创新发展,本文探讨了智能楼宇管理系统运维人才队伍建设问题。
都江堰世界遗产是世界水利工程的杰出代表,文章以城市历史景观作为方法论,以真实性、完整性、可持续性为视角,将涵盖整个都江堰城乡完整的农田系统和水利系统纳入研究范畴,重新识