相关反馈中特征过滤策略的研究与应用

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:f168168f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web技术的普及和信息技术的发展、推广与应用,以图像、声音和视频为主的多媒体信息迅速成为信息交流和服务的主流,现代信息处理的对象和方法都有了很大的变化。大量各种类型的信息在全球得到了采集、传输、流通和应用,人们正在快速进入一个信息化的社会。大规模图像数据库的出现和应用,使得高效的检索机制成为目前迫切需要解决的问题,而基于内容的图像检索技术便是解决这一问题的关键。鉴于语义特征提取的困难性,基于底层特征的图像检索仍是目前比较常用的方法。然而,底层特征上的相似性不一定能反应语义上的相似性以及用户对图像的感知。图像检索系统的最终用户是人,因此通过交互手段来捕获人对图像内容的认知是相当重要的。为了把用户模型嵌入到图像检索系统,最近几年在基于内容的图像检索领域引入了相关反馈机制。相关反馈技术已经被证实是一项强大的技术应用于可交互的基于内容图像检索。尽管已经有不少先进的学习技术提出来构建相关反馈算法,比如支持向量机(SVM)等,目前的技术仍有许多缺陷和不足,其中包括以下几个方面:(1)较少考虑非常有限的训练样本的影响;(2)通常假设训练样本只来自一个正类和一个负类;(3)“维数灾难”和“语义鸿沟”问题;(4)需要多次反馈学习才能得到比较理想的结果。针对这些问题,本论文研究基于内容图像检索中的相关反馈的学习问题,并通过不同的角度提出有效的算法来改善这些问题。首先,我们提出一种最小距离排序的查询优化方法,来克服训练样本非常有限的问题。该方法,基于最近邻分类思想,使用相对排序,将每个反馈正例当作一次单独的查询。实验结果表明,我们提出的方法在训练样本非常有限的情况下能够有效地改善检索的性能。其次,传统的相关反馈学习技术通常认为训练样本只来自一个正类和一个负类,更实用和合理的做法是考虑相关样本来自多个正类,而无关样本来自多个负类。基于这种扩展,我们提出一种新的基于监督聚类的相关反馈算法,该算法在负例图像的监督下,根据底层特征对语义上相似的正例图像进行分类。此外,“维数灾难”和“语义鸿沟”仍是图像检索面临的重大问题,利用特征选择来进行维数约减是图像检索的必要环节。为了改善这些问题,我们提出一种新的特征选择方法,即基于负例监督的特征过滤策略,目的是找出正例样本间的共性,根据用户对图像的理解提取约减的特征集。对比实验表明,不仅可以提高相似性度量的速度,而且有助于缩小“语义鸿沟”问题。实验证明,我们的算法,不仅可以解决传统算法中的缺陷,尤其当反馈样本和反馈次数较少时,检索性能有较大的提高。
其他文献
有效的运动估计可以减少运动补偿残差帧中的能量,能够明显提高视频的压缩性能。本文系统分析了两种不同的运动估计方案:分级运动估计和变换域运动估计。运动补偿的嵌入式零块
Map Reduce作为一个并行处理的计算模型,因为其高容错性,高易用性,以及高扩展性在大规模分布式数据处理中得到广泛的应用。Map Reduce可以处理关系数据库中一些操作,像是选择
系统结构模型的构建是点对点技术的核心研究领域之一。全分布式结构化的系统把节点组织成一个具有良好的连接和路由规律的结构化拓扑来进行资源共享和查询。在结构化网络中,
随着计算机互联网的发展和广泛应用,网络安全问题变得越来越严重。因此,开展网络安全特别是入侵攻击与防范技术的研究,开发高效实用的入侵检测系统,对计算机网络的发展与应用
在图书馆流通中,每天都产生大量的数据,怎样合理地利用这些信息为图书馆管理服务,是我们迫切需要研究的课题。目前的图书馆管理系统无法发现这些数据中存在的关系和规则,无法
随着互联网的普及,信息的数量与日俱增,人们需要从海量的信息中提取真正需要的信息,信息抽取的研究正是在这种背景下产生的。信息抽取的主要目的是将无结构的文本转化为结构
随着企业生产规模的不断扩大,自动化立体仓库由于其物资存储效率高,占用空间少等特点越来越被广泛应用。立体仓库主要使用固定货架来存放货物,对固定货架货物拣选路径的优化
随着因特网技术的迅速发展和不断的普及。Web日志资源越来越丰富,如何充分利用这些资源,从中提取到用户所感兴趣的信息数据,是当前计算机领域的一大挑战。Web日志挖掘就是利用数
数字水印技术作为信息隐藏理论的一个重要分支,是目前信息安全领域一个新的研究方向,在数字作品版权保护、保密通信等领域会发挥重要的作用。进一步提高空域算法的鲁棒性,通
现有的Ad hoc网络低能耗协议中,多数是针对单独的数据链路层或网络层进行协议设计,而没有根据网络五层协议栈进行设计,良好的Ad hoc网络协议需要上下层互相协助,现有的Ad hoc网络