场景图像分类方法研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:try111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景图像分类(Scene Image Classification)是依据一组给定的语义标签来对图像数据集自动分类,其是目标识别、图像检索、视频标注等的基础,近年来已成为模式识别和计算机视觉领域的研究热点。场景图像分类的主要任务是让计算机能够像人类一样认知和理解图像所包含语义信息,其难点在于如何有效地区分场景类内的差异性和场景类间的相似性。基于此目的,本文研究了如何从场景图像中提出有效的判别特征,来弥补图像低层视觉特征和高层语义信息之间的语义鸿沟。本文的主要贡献有:  (1)提出了空间局部二值模式(Spatial Local Binary Patterns,SLBP)的算法,SLBP是对经典的LBP的一种改进,其在不同的方向、不同的投影中心及不同的尺度上投影LBP描述子,从而最大程度地编码了图像中物体的空间信息以及物体之间的相互关系信息,然后采用多核的方法度量图像之间的相似程度;  (2)、提出采用多层次核机器的方法改进空间PACT(Principal component Analysis ofCensus Transforn histogramS,PACT)方法,使其在不同的空间金字塔尺度上对场景图像分类具有不同的贡献,从而在整体上提升场景图像分类的性能;  (3)、提出了基于非负稀疏编码(Non-Negative Sparse Coding,NNSC)的多池组合策略联合的表示图像语义信息。首先非负稀疏编码用于学习视觉词典和编码描述子,然后使用多池组合(Multiple Pooling Combination)策略将多种池方法投射的特征组合起来表述图像场景特征,从而进一步降低了图像编码过程中的信息损失。  最后,多类的支持向量机(Support Vector Machine,SVM)分类器用来执行场景图像分类任务。多个公用数据集上的大量实验结果表明,提出的场景图像分类方法具有很高的正确分类率和很强的鲁棒性,从而证明了我们提出的方法的有效性。
其他文献
永磁无刷直流电机具有转动惯量小、功率密度高、控制性能好等优点,所以在众多领域中应用广泛,同时也是航空、航天和航海等领域用电机的重要发展方向。本文根据SinoProbe国家深
火灾报警系统是智能楼宇系统的一个重要组成部分,目前常用的火灾报警系统大多采用有线通信方式,需要在楼内布置大量的通信线缆,结构复杂,施工成本高,适应性和使用灵活性都不理想。
近年来,随着计算机水平和计算机视觉技术的不断发展,智能视频监控系统已成为了一个新兴的应用方向和备受关注的前沿课题。基于图像序列的运动目标跟踪是计算机视觉领域和数字
磁流体是一种纳米功能材料,具有磁性材料的磁性和液体流动性,具有特殊的物理性质,特别是在光学上表现出了非凡的性质。本文从理论和实验对磁流体的光学透射特性进行了研究。
随着人口老龄化进程的加快以及人们承受精神压力的增大,神经与精神疾病的发病率在世界范围内逐年攀升,已引起了越来越多的医生和研究人员的注意。神经影像技术尤其是磁共振技
井地电位测量技术是用于剩余油分布评估的一种石油电法勘探技术。井地电位测量系统主要由发送机系统和接收机系统组成,发送机系统产生大功率低频电流脉冲信号,通过发射极向井
随着科学技术的不断进步和生产力的飞速发展,消费者的需求越来越多样化与个性化,为了满足市场需求,制造企业逐渐从原来一元化、单品种、大批量、流水线式的生产方式,向多元化、多品种、小批量、高柔性的生产方式转变,这就增加了企业的生产计划与调度的难度。有效的生产调度与计划方案,对提高制造型企业的生产效益和资源利用率,降低生产成本有着重要的意义。作业车间调度问题(Job Shop Scheduling Pro
基于视觉的行人检测与计数,是指在人在不干预或极少干预的情况下,分析视觉传感器获取的信号(例如由固定摄像头拍摄到的图像序列),实现对行人的识别,定位,跟踪和计数。利用这
本文主要针对行人保护系统中基于移动视觉平台的行人检测和跟踪这些关键技术进行研究。行人保护系统力图在汽车等移动平台上建立一个自主、智能的行人检测、跟踪、辅助驾驶系
复杂场景中的多目标跟踪是计算机视觉领域的关键技术之一,在民用和国防诸多领域中均具有极为广阔的应用前景。在单目固定摄像机实现复杂场景的多目标视频监控时,由于观察角度等