论文部分内容阅读
自然场景感知是让计算机视觉系统拥有和人类类似的场景感知能力,得到符合人类习惯的场景语义描述。快速和精准的自然场景感知功能是智能图像分析系统必不可少的,它能够缩小目标搜索的范围,排除上下文语义解释不一致的目标。随着拥有视觉的智能系统对图像处理智能化要求的日益提高,自然场景感知已成为机器视觉领域里的研究热点。针对使用gist特征分类场景正确率不是很理想以及计算量大的问题,提出了使用改进的局部特征描述场景内容的局部语义概念模型BOHOG2和语义属性模型HOG+3gist。BOHOG2模型是将HOG与三尺度gist特征结合作为改进的图像局部特征描述,对训练集中图像的局部特征进行聚类,得到用来量化局部特征的视觉词汇,最后用视觉词汇在图像中的分布情况作为场景内容的描述。HOG+3gist模型直接使用改进的局部特征作为图像的局部语义属性描述。在两个自然场景图像数据库上,用支撑向量机对两种模型的特征进行学习、分类,实验结果表明两种模型的分类正确率均比原始的gist特征好。对比HOG+3gist与原始gist特征提取所使用的时间,表明提出的方法能加快特征的提取速度。针对常用的几种场景感知方法,对大多数室内场景的分类正确率不是很理想的情况,提出了基于双目立体视觉的室内场景感知方法。将双目立体视觉得到室内场景视差图,模型化为一系列的平面,在指定的不同区域里拟合出相应数量的平面,将归一化的平面法向和尺寸参数与HOG+3gist特征结合作为场景的特征描述,使用支撑向量机对构建的室内双目立体场景数据集进行学习、分类,提出的方法平均分类正确率为73.7%,比HOG+3gistt方法高13.2%。实验结果表明,将双目立体视觉得到的场景三维结构信息与二维图像特征结合作为场景的描述和仅使用二维图像特征描述场景相比,能够提高室内场景的分类正确率。