Semantic-Tree—时态XML索引方案

来源 :山东大学 | 被引量 : 0次 | 上传用户:liongliong503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML的全称是Extensible Markup Language(可扩展标识语言)由于具有简单、可扩展、互操作性强,开放性强等特点,正迅速成为一种与技术无关的数据交换的标准和传输格式。鉴于XML在很多领域有广泛的应用前景,许多关于XML的研究都是前沿和热点课题。例如在数据库领域,从某种意义上说XML作为数据库使用可以自然地表示嵌套型数据,比关系型数据库具有更强的表达能力。但是由于XML索引还有很多不完善的地方,直接对XML文档的查询比在关系型数据库上的查询在效率上还差很远。学术界对XML索引技术的研究由来已久,尽管有一定的成果,但是还有很多可以改进的地方.时态XML是为了处理在电子商务、电子政务等领域日益扮演重要角色的时态信息而产生的,是XML技术的一个新兴的研究分支。它相对于时态关系型数据库具有更直观地表达时态信息的数据模型,因此目前时态XML的主要应用是数据存储。对于提高在时态XML文档上的查询效率,传统的XML索引并不是很有效,可以说时态XML还缺乏一些专用的索引技术,在这方面的研究目前还基本上是空白的。本文研究了时态XML的数据模型,以及基于此数据模型创建了索引模型,通过创建索引优化了基于时间的查询。本文首先介绍XML模型和时态XML模型,其次讨论了XML编码方法的研究和应用概况,并分析了当前比较流行的几种编码方法的优缺点。同时在前序编码的基础上提出了预留前序编码的思想。然后将结点表,语义树,语义时间划分表相结合,提出了一种改进的XMI路径索引方法,其中心思想是对路径索引树中的各个节点进行编码,存储在结点表中能够快速判断XML文档树中节点间的祖先/后裔关系和双亲/孩子关系,能有效的支持XPath路径表达式查询和关键字搜索,同时建立语义树,能够快速的构成语义的相对关系,并同语义结点聚合,划分时间段,形成语义时间划分表,快速查找到某时间区间对应的节点集合。同时本文给出了索引的建立算法,以及更新,删除和查询算法。最后我们通过实验证实了创建的索引是可行的和有效的。
其他文献
随着数据库技术、因特网、电信技术等信息技术的飞速发展,时间序列数据在现实生产和生活的各个领域中广泛存在(如电信运营、金融市场、工业过程、科学实验、医疗、气象、生物信
随着计算机网络的迅速发展,网络攻击的方式越来越多,传统的网络入侵防御技术,如防火墙、入侵检测系统等,已经难以应对层出不穷的攻击手段。尤其是这些实用的技术大都是被动防御型
分类讨论思想是高中重要的数学思想,也是高考考查的重点.一、正难则反思想,有效避免讨论有时正面直接思考问题,需要分多种情况考虑.而如果考察对立面,可能情况会显得更简单,
不久前,人民日报载文介绍了欢迎舆论监督的徐州市委书记郑良玉同志,郑良玉读罢报纸,发自内心地说:“其实,我们的新闻单位既是党领导下的舆论工具,又担负着人民群众监督人民
在目前的商业特征造型系统中,对特征的直接操作还没有得到广泛的应用。结果,重复的设计过程不仅耗时还导致不能实时有效的得到反馈,缺乏对设计结果的洞察,对特征的互操作也缺
随着电信市场的快速发展,数据业务量呈现迅猛的增长,为网络运营商和设备商带来了新的机遇与挑战。为了满足日益增长的数据业务需求和服务质量要求,国内的运营商开始在现有SDH
2月下旬,新华社发了《今日得宽余——退下来以后的邓小平》一组照片,各报纷纷转载。读者看到了邓小平同志在室内悠然自得地阅读报纸、与孙子在庭院共享天伦之乐等场景,感到
来到天津,听说天津日报这几年经营搞得很活,特去拜访了天津日纸主其事的女能人——散帼英。她现在是报社副秘书长兼办公室主任,又是报社读者服务公司的副董事长兼总经理。五
青光眼是一种致盲性特别高的眼部疾病,它能够引起视盘和视杯形态的显著变化。视杯和视盘比值(简称杯盘比)的测量在青光眼的检测中尤为重要。目前较为成熟的青光眼检测方法大
时间序列是按照时间排序的一组随机变量,广泛地存在于生活中的诸多领域,包括气象、金融、农业、生物等,挖掘隐含其中有用的知识对实际生活生产有重大作用和意义。时间序列预测作