Hash-Search:基于哈希表的快速XML关键字检索算法

来源 :第二十五届中国数据库学术会议(NDBC2008) | 被引量 : 0次 | 上传用户：lezhe14790511

【摘要】

：

随着XML的广泛应用,XML上的关键字检索逐渐成为一个研究热点.现有的关键字检索方法主要基于LCA计算和候选点选择两种操作,存在以下问题:首先,现有方法利用Dewey编码来表示结

【作者】

：

王伟彦[1]张博[1]王晓玲[1]周傲英[2]

【机构】

：

复旦大学Web数据库与P2P计算实验室上海 200433

【出处】

：

第二十五届中国数据库学术会议(NDBC2008)

【发表日期】

：

2008年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着XML的广泛应用,XML上的关键字检索逐渐成为一个研究热点.现有的关键字检索方法主要基于LCA计算和候选点选择两种操作,存在以下问题:首先,现有方法利用Dewey编码来表示结点,LCA的计算过程需要逐段地比较Dewey编码,当XML深度很大时,大量的LCA计算会影响算法的性能.其次,为了确定候选点(即用于进行LCA计算的结点),需要对结点集进行遍历,当结点集很大时,查找过程比较耗时.针对以上问题,首先提出一种基于哈希表的索引结构来记录结点和标签之间的关系。基于这种索引结构,进一步设计了高效的关键字检索算法——Hash-Search算法,避免了LCA计算和确定候选点过程.在理论上提供了算法的正确性证明和复杂度分析,并进行了实验测试,表明Hash-Search算法是一种高效的XML关键字检索算法。

其他文献

VCTPR-tree:一种支持预测查询的高效时空索引结构

TPR*-tree是当前流行的用于查询移动对象当前及将来某一时刻位置信息的索引结构.但是,TPR*-tree在构建时忽视了同一方向上速度间存在的大小差异,因而可能导致产生大量无效区

会议

预测查询时空索引结构移动对象位置信息速度区域查询性能查询效率时间戳TPR问题流行构建改进差异

数据流上复杂事件处理系统Eagle的设计与实现

近年来,随着传感器网络和RFID技术的发展,基于数据流的应用已经无所不在.数据流上的应用大多是监控型的,并且这些监控任务一般是简单事件的组合,但简单的数据流处理系统(DSMS

会议

已婚妇女生殖道感染患病情况及影响因素的研究

目的　了解已婚妇女生殖道感染的患病情况及相关危险影响因素。方法　对 30 6 7例 2 2～ 6 0岁已婚妇女进行问卷调查、妇科检查和有关实验室检查 ,有关数据应用计算机SPSS/PC 9

期刊

妇女生殖道感染影响因素已婚妇女细菌性阴道病念珠菌性阴道炎老年性阴道炎个人卫生习惯感染史月经状况常规妇科检查

OLAP中紧凑数据立方体研究综述

为支持各种联机分析型应用,需要存储物化数据立方的海量数据.紧凑立方体通过挖掘多条立方元组之间的共性以及各属性之间的依赖关系来消除冗余,大大减少了存储代价.介绍了紧凑

会议

OLAP数据立方体依赖关系研究方向压缩效果消除冗余海量数据分析比较存储产生背景分析型属性物化问题挖掘联机典型

基于KNN-Join和SNN相似度的空间异常点检测算法

空间异常点是和其空间邻域对象不一致的数据对象或者在数据集中远远偏离其他对象的那些小比例时象.空间异常点的检测在地理信息系统和空间数据库的应用中都有着重要的意义。

会议

空间属性异常点非空间属性异常点KNN-JoinSNN相似度空间异常点数据集地理信息系统

基于ESAX表示的时间序列相似性度量

时间序列的近似表示和相似性度量是时间序列挖掘的研究基础,对提高挖掘任务的效率和准确性至关重要.基于时间序列的ESAX(Extended Symbolic Aggregate Approximation)近似表

会议

ESAX表示时间序列挖掘相似性度量符号化统计向量

黄宗英自述(上)

一我,黄宗英。1925年7月13日,即民国十四年五月二十三日生于北京,属牛。母亲怀我产期未到,忽阵痛,赶忙遣人去请产婆。产婆未到,我就已经生出来了。家人都说我是急性子。母亲

期刊

黄宗英甜姐儿怀我孙道临大弟南北剧社黄佐临职业剧团卫禹平对我说

基于反馈的用户访问预测模型

用户的访问预测是Web日志挖掘的重要分支,在过去的几年里,研究者们先后提出了基于关联规则、Markov模型、频繁访问模式和点击流树等预测模型.它们不考虑用户的反馈,无法判断

会议

对高职教务管理系统的研究

近几年,我国高等教育在招生规模上持续扩大,传统的手工管理方式工作量大,费时、费力、效率低,而各高校教务管理工作的“个性”化而又不宜采用商业化的教务软件。现着重介绍一

期刊

C/S模式B/S模式教务管理管理信息系统

支持向量机Top-k查询的特征空间近邻索引

特征空间索引是提高大规模支持向量机SVM(Support Vector Machine)查询效率的关键,在多媒体数据库及信息检索领域具有重要的应用前景.为了进一步提高SVM特征空间索引的效率,

会议

Hash-Search:基于哈希表的快速XML关键字检索算法

与本文相关的学术论文