高维数据索引结构研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:magi9999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和多媒体技术的迅速发展,人们可以访问到的多媒体数据急剧增长,如何实现多媒体数据对象的相似检索成为一个非常重要的研究课题。通常,人们利用特征提取算法从多媒体数据对象中提取出特征矢量,然后利用特征矢量之间距离表示多媒体对象之间相似度。相似性检索的实现就是通过计算查询矢量与数据库中矢量之间距离以找出满足条件的对象。当数据库中矢量很多时,简单的顺序扫描搜索将导致极大查询代价,无法满足用户需求。为了有效实现快速相似性检索,就必须借助于高效的高维数据索引结构。 在最近几十年中,人们提出了很多高维数据索引结构,其中大多是树形结构,如R-Tree、R~*-Tree等,这些索引结构在维数升高时性能会急剧下降,即所谓的“维数灾难”,为此,有人提出了通过近似压缩矢量来减少磁盘I/O代价的VA-File,但仍不能为高维数据的相似性检索提供良好的查询性能。针对高维数据索引结构的现状,我们在该领域进行了深入研究,取得了一定的成果。 首先,我们提出了四种新的索引结构:1) Angle-Tree:用高维空间中单位超球面上的超弧对空间进行划分,并借助于树形结构实现索引,可有效支持以矢量之间夹角余弦为相似度度量的查询方式;2) VAR-Tree:将VA-File与R-Tree有机结合起来,用R-Tree来管理和组织近似矢量数据,并借助R-Tree类相似查询算法实现基于VAR-Tree的查询;3) VA-Trie:利用Tile结构来索引VA-File中近似矢量,有效实现了高维数据的相似性检索;4) OVA-File:将VA-File中近似矢量插入到近似文件中合适位置,使得在高维空间中相邻数据尽量存放在近似文件的相近位置上,从而在查询过程中仅访问部分近似矢量,就可快速得到质量很高的相似查询结果。 其次,在高维数据索引结构研究基础上,本文分别给出了基于VA-File和OVA-File的、以高维矢量序列为查询对象的视频片断相似查询方法,以有效利用高维索引结构同时支持视频信息检索中的镜头检索和视频片断检索。 最后,结合一个实际的多媒体信息检索系统,进一步阐述高维索引结构在实际系统中的应用。我们利用OVA-File管理来自于海量视频数据的高维矢量,基于镜头和视频片断相似查询模型实现了视频数据的快速相似性检索。
其他文献
在反求工程中,三角网格不仅仅是实物原型曲面重构的基础,还贯穿于整个反求工程全过程发挥作用,如应用于快速原型制造、真实感模型显示、重构曲面再设计等反求工程的各个方面。研
目的观察手辅式腹腔镜左半肝切除术应用的安全性及有效性。方法回顾分析在行手辅式腹腔镜左半肝切除术的患者20例,并与同期行开腹左半肝切除术的患者24例进行比较,对比两组的手
目的:控制糖化血红蛋白作为稳定性缺血性心脏病合并糖尿病患者综合危险因素管理的重要性存在争议。本研究的目的是确定1年内控制危险因素,包括糖化血红蛋白,是否影响稳定性缺
空间数据的多重表达就是用不同的空间数据来表达相同的空间场景或者同一种空间现象。这些空间数据或者在详细程度上不同,或者在数据表达模型上有所区别(如矢量模型和栅格模型
进入21世纪以来,创业精神和创业教育日益成为人们熟悉和关注的话题。创业教育的先进理念和重要意义同样引起了中国教育界的重视及反思,中国各高校也纷纷效仿欧美商学院,开始引入
中小企业的集群核心竞争力来源于技术创新、区域市场、集群文化及组织管理。通过练好内功,提升技术与管理创新能力;巧借外力,营造良好的集群环境;内外结合,共创区域品牌,可促
本文对如何将部分解析技术引入意见挖掘,以提高分析的有效性问题进行了研究,其成果概括如下:(1)提出了基于部分解析的超解析方法及其增量式实现近似文本分析(ATA)(见第2章)。超
期刊
我国拥有悠久的历史,历史文化遗产众多。文物是先辈留给我们的无价之宝,文物在古代历史文化的研究中有着举足轻重的地位。然而,受自然和人为因素的影响,文物损毁严重,因此,要
从中医文化“形而上”的思辨原则、以“治未病”为逻辑起点的生命观和“兼内外”的养生追求,剖析中医文化辩证思维的优势价值与魅力。而在对中医文化定式思维的反思中,又发现中