XML索引和过滤查询若干关键技术研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:djxhh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(eXtensible Markup Language)作为网络数据交换和信息集成的工具,以其自描述性、跨平台交换性等特点,成为新一代的网络语言。互联网上越来越多的结构化或半结构化的数据采用XML格式存储和交换,对XML数据的索引及过滤查询研究显得日益重要。 本文根据XML数据的自身特点和当前实际应用需求,就索引和过滤查询的一些关键技术进行了研究,具体包括XML文档索引查询技术研究、XML文档树节点编码研究、遵循不同模式XML数据集索引模型、集群式XPath查询优化、XML数据过滤查询技术研究、XML文档索引和过滤查询原型系统的实现等方面,所做的工作和取得的创新成果体现在以下五个方面: 1) 基于互关联后继树的XML文档索引技术研究 基于叶序区间编码方法(LOINS)与互关联后继树模型(IRST)为节点带有名称(标签)的根树建立索引模型。结合IRST的标引性、可压缩性等特点,本文提出了基于IRST的根树索引模型IsBaRTI-Ⅰ,及该模型的空间优化模型IsBaRTI-Ⅱ。IsBaRTI-Ⅰ,Ⅱ采用树节点名称(标签)及其在根树(XML文档树)中的出现计数索引节点间的父子关系和节点叶序区间编码,实现索引结构和节点编码的相互统一。理论和实验证明,在对XML路径表达式的查询处理中,和以往同类索引模型相比,IsBaRTI-Ⅰ,Ⅱ索引建立时间、空间代价小,而且可快速查询满足XPath表达式在XML文档树中的节点序列和路径。 2) XML文档树节点叶序区间动态编码研究 在XML索引上采用树节点编码可快速判断树节点间的前后代关系,树节点编码代价影响着索引的空间代价和驻留内存空间的难易程度。区别于以往同类索引模型研究仅仅注重提高查询效率的片面性,本文针对Web上XML文档特点,就本文索引技术中的树节点叶序区间编码和其它树节点编码方法,如:顺序标识区间编码、前缀编码等进行比较。相比其它树节点编码方法,本文提出的叶序区间编码方法编码长度代价小、编码灵活机动性强(可通过IsBaRTI-Ⅱ在索引结构中动态查找)。我们提出的根树索引模型IsBaRTI-Ⅱ动态查找叶序区间编码的平均时间代价随着S/H(S为根树Tr节点出度;H为Tr高度)递增而递减且趋近于1,而Web上XML文档树普遍具有的S>>H的特点为基于IsBaRTI-Ⅱ实现的XML索引模型动态查找叶序区间编码提供了实际应用可行性。就树节点叶序区间编码的维护,本文提出了基于XML模式扩展叶序区间编码的方法,降低XML文档树节点插入时的索引中节点编码维护代价,为基于叶序区间编码的XML索引模型提供了编码维护方案。
其他文献
现有GIS空间分析技术不能满足多维信息空间分析的需求,如何将空间依赖、空间尺度效应、空间非均质性共同结合到空间分析中缺少有效模式,空间分析中数据的多维复杂性往往被忽
随着电子地图在路勘测、设计中的广泛应用。KML也被工程设计人员大面积、高频率的使用在道路勘察设计,包括方案汇报、可行性研究报告、初步设计等。下面我就结合近几年来工作
甲亢患者甲状腺细胞碘代谢极为活跃,其吸^131I率往往高于正常,大多数患者适于用^131I治疗,但甲状腺吸^131I率偏低能否行^131I治疗,笔者对此进行了临床研究。甲亢甲状腺吸^131I率
高压氧(HBO)治疗是在高气压环境下进行的吸纯氧治疗,存在不安全因素,加上患者对氧舱的恐惧和对治疗过程认识的不足,易产生一些不良反应,现将HBO治疗中常见不良反应的分析及护理报告
推进学风建设是高校一项长期而艰巨的任务,也是在高等教育大众化背景下提高教育质量、培养人才的重要举措。心理契约作为管理学的一种机制,在管理领域广泛应用。本文探讨心理
红外探测器接收目标红外辐射是深空目标识别的主要手段。由于深空试验开展受诸多条件限制,所以需要通过计算目标的温度场分布以及目标的红外辐射特性来开展仿真试验。本文研
高等学校管理要正确处理好几个关系,转变观念,进行组织创新和评价体系创新,提升管理水平和教育质量。
(武汉大学 后勤服务集团,湖北 武汉 430072)  摘要:随着高校的开放程度进一步加大,社会服务集团挟品牌、资本之优势,已在校内不断扩张,同时也加强了行业竞争,从整体上提高各高校后勤的经营水平、资产增值能力和品牌力势在必行  关键词:高校后勤;标准化建设;后勤服务;服务差距;服务管理  中图分类号:G472 文献标志码:A 文章编号:1674-9324(2017)24-0009-02  随着高