支持SVM查询的近邻索引

来源 :复旦大学 | 被引量 : 0次 | 上传用户:prcjzzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机计算能力的逐渐增强和Internet技术的迅速发展,有越来越多的图像和视频数据被发布到互联网上,涌现了海量的多媒体数据。与传统的结构化数据相比,图像和视频等多媒体数据语义更加丰富。多媒体数据的管理对于传统的数据库管理构成了巨大的挑战;对于多媒体数据的组织,存储和检索成为了亟待解决的问题。基于内容的图像检索(CBIR)[8]希望利用图像的颜色,形状和纹理等视觉特征找到具有相似语义的图像。目前,人们已经针对特征提取,检索方法等CBIR的各个环节提出了多种算法;这些算法的提出对于查找具有相似语义的图像有所帮助;但由于语义鸿沟的存在,CBIR的问题还不能得到彻底解决。允许用户在查询过程中对查询结果进行反馈[20],并根据用户反馈调整查询结果的交互式查询方法是目前比较流行的一种效果较好的CBIR方法。[18]它首先根据用户提供的查询图像训练分类器,然后使用分类器对数据库中的图像分类,并把与查询图像具有相同类标签的图像排序后作为查询结果返回,用户可以对查询结果给予反馈,系统会根据用户的反馈进一步调整查询结果,使其更加准确。查询过程可能包含多轮反馈,直到查询结果令用户满意为止。支持向量机(SVM)[1,11,12]是一种性能优越的分类器,广泛应用于包括文本分类[6],图像检索[4]在内的多个领域。但SVM的运算速度比较慢,难以实现实时SVM图像检索系统,因而需要展开对支持SVM查询的索引的研究。本文在SVM特征空间中引入近邻索引的方法,提出了基于聚类的近邻索引和基于马尔科夫随机游走模型[16,24]的近邻索引两种索引方法。它们的基本思想都是根据特征空间中数据点的近邻关系建立索引结构以支持SVM查询。前者将数据集划分成若干子类,根据子类之间的近邻关系建立索引;查询时通过迭代的子类近邻查询找到一些候选子类,然后再深入考察每个候选子类最终得到查询结果。该方法在保证查询准确率的前提下能够大大提高查询速度,而且索引结构的空间占用很小,具有较好的可扩展性。后者将数据集看成网络图结构,利用马尔科夫随机游走模型计算数据集中各点进行t步游走后可达的点以及到达这些点的概率作为索引;查询时直接查询索引得到候选点,再通过计算各候选点到各支持向量的最短路径加权和来为候选点排序,得到最终查询结果。本文的实验分别在包含约74万幅图像和包含约21000幅图像的数据集上使用上述两种算法实现了图像检索系统。从实验结果可知,本文提出的两种特征空间近邻索引算法,对SVM图像检索的查询速度和准确度都有所提高。
其他文献
与文本无关的说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域有着良好的应用前景。 本文介绍了说话人识别系统中需要用到的理论和方法例如高斯混合模
随着信息社会的快速发展和网络的广泛应用,每天从社交网络、业务交易以及传感器等应用中产生的数据难以计数。尽管传统的哈希技术能够很大程度上压缩数据并提高数据管理性能,但
集传感器技术、嵌入式计算技术、分布式信息处理技术和通信技术于一体的无线集成传感器网络以其低廉的价格、便利的部署方式正得到越来越广泛的使用,对传感器网络各个方面的
随着计算机科学技术的发展,其应用的领域也越来越广泛。在图像处理领域中,处理的数据量巨大,提高图像处理的速度就是一个巨大的挑战,这是由图像数据的特点和图像处理算法的复
独立分量分析(Independent Component Analysis, ICA)作为一种变换方法,在神经网络、盲源分离、统计分析等领域的有着广泛的应用,它在过去二十年尤其是近十年内得到了长足的
本文在假定深度的基础上提出一种几何物体位姿计算的方法,并且初步研究位姿计算中基本几何物体的三维感知经验。文章首先概述了位姿计算的基本研究背景综述了一些基本的研究
P2P(Peer-to-Peer)技术作为Internet的重要技术之一,近些年来受到了计算机业界越来越多的关注。P2P技术直接将人们联系起来,让人们通过互联网可以直接交流。P2P使得网络上的
数字图像和视频修复是填充图像或视频内指定的破损区域的处理过程,是当前计算机图形学、计算机视觉和图像处理的研究热点领域之一。目前,图像修复的基本方法主要有两大类:基
近年来,随着生物测序技术的突飞猛进,现代生物技术的研究取得了突破性的进展,生物序列数据以前所未有的速度增长。人工分析和处理生物序列数据已无法满足需要,如何分析和处理
能耗问题是近年来人们在嵌入式系统设计中普遍关注的热点,它严重影响着嵌入式系统的应用与发展。Cache即高速缓冲存储器,作为处理器与主存之间的关键桥梁,在优化计算机系统的