基于眼动先验的显著性检测

来源 :天津大学 | 被引量 : 0次 | 上传用户:kwatog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物学上的研究表明,人类的视觉系统存在选择性注意机制,能够使得人在看到某个场景时,快速地将注意力集中到该场景中信息量最大的区域。视觉显著性检测就是模拟人类视觉系统这种选择性注意机制,使得计算机在处理图像或者某个场景的视频时能够更加快速和智能。如何从一幅图像中自动且准确地提取出最吸引关注的区域,就是显著性检测的主要目标。显著性检测作为计算机视觉领域中一个独立的研究方向,可以为分析和理解图像内容提供极大的帮助,在预处理阶段首先对图像进行显著性检测,可以极大地提高后续数据处理的效率,对其他领域的研究有着十分重要的意义。本文首先对目前显著性检测研究的发展和经典检测算法进行了简要的回顾和介绍,重点分析了当前基于学习的显著性检测算法的特点和存在的一些问题。之后,提出一种基于眼动数据图像特征稀疏约束的显著性检测算法。该算法首先建立一个包括多种图像特征的特征池,之后假设图像的显著图由特征池中特征的线性组合表示,并用带有稀疏约束的线性回归方法从眼动追踪数据库的先验信息中学习出该线性组合的权重参数。相较于其他基于学习的显著性检测方法,本算法更加充分地挖掘了眼动数据库中的显著性先验信息,不仅能够自动生成特征融合参数,还能够起到特征选择,去除冗余信息的目的。实验表明,用该算法构造得到的显著性检测模型在检测准确度和检测效率上都有很好的表现。本文还提出一种基于眼动数据显著性先验的视觉特征提取方法。该方法以图像块为基本操作单位,首先利用颜色、亮度、方向特性构造图像块代表特征;之后用k-means聚类的方法生成图像块标识映射集合并计算其显著性程度;最后,对于待检测的图像,在进行分块和图像块分类之后,就可以按照图像块映射集合计算其显著性先验特征。实验表明,在将该特征加入显著性检测模型中后,模型的检测效果会有明显提升。
其他文献
多媒体应用是近年来计算机领域的研究热点。多媒体应用的代码往往具有较高的并行度。为了获得更高的性能,几乎所有的处理器厂商都为其处理器增加了多媒体扩展,以充分利用处理
广播电视是人们最常见、也是最广泛的视频形式,广播电视中会出现电视节目盗播、广告不能按约定的时间、数量播放等各种问题,对电视节目播出过程进行实时的不间断地监控,是保证节
二次雷达一直是国内、外民航空中交通管制和敌我识别领域的研究热点,发展至今,单脉冲二次雷达和模式S二次雷达系统正在得到逐步完善。本论文介绍了二次雷达询问模式理论,重点
信息社会的高速发展,使得媒介资源、存储资源显得更加宝贵。因此,压缩语音信号的传输带宽一直是人们追求的目标。MELP算法在LPC模型基础上,吸收了多带激励算法的优点,通过引
三维重建是计算机视觉的一个重要的研究方向,主要应用于自主机器人导航、目标识别以及真实场景重现。面向无人机自主着陆导航需求,本文提出了三维地形重建处理框架,侧重于合
随着三维扫描设备中深度传感器的广泛应用,三维曲面的配准成为计算机视觉中的一个关键问题。其中非刚性配准比刚性配准更具挑战性,因为它需要为每个三维坐标点分别求得一个变
纹理在自然界中广泛存在,大多数物体的表面均可称之为纹理,它反映了物体的物理属性。近年来,以局部二值模式(local binary pattern,LBP)为代表的纹理特征被广泛应用到模式识
HiNOC是利用有线电视同轴电缆的带外信道组建高速和高质量的多业务宽带接入网的一种新型接入技术。该技术完全利用现有有线电视网同轴电缆的网络布线,利用860MHz以上的同轴电
随着目前各种数字设备的快速普及,数字图像逐渐充斥着人们生产生活的各个领域,而各种图像处理软件的产生使得对数字图像的篡改越来越容易。假如这些数字图像被人恶意伪造和篡
罗兰-C导航系统是陆基100kHz脉冲长波导航定位系统,具有覆盖范围大、全天候、成本低、抗干扰能力强、可靠性高、稳定性好等优点,是弥补卫星导航抗干扰能力差的首选方法。但罗