XML文档数据查询技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ilclean
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展和普及,人们通过计算机与互联网联接,可以从世界各地实时的接收和发送大量、最新的信息,但在信息交换过程中存在着一个突出的问题,就是多种多样的数据格式,给信息的有效使用带来了障碍。所以如何以最便捷、最可靠、最有效的方式获取所需的信息是一个很大的困扰。XML作为基于WEB应用的一种电子数据交换标准,以其自身卓越的优势,尤其是跨平台、异构数据交换的功能,正成为下一代网络电子数据交换的最佳选择,已被广泛应用于商业、教育、通讯等各种领域。关于XML数据存储和查询的研究也正方兴未艾。 目前关于XML数据查询的研究主要集中于基于路径表达式的XML数据查询。从研究新的查询方法、索引结构、操作符重写及路径表达式自身优化等方面,探讨提高查询效率的问题。例如:路径表达式模板匹配方法、基于B+树的结构联合方法、基于后缀树的索引方法、路径表达式重写索引查询方法、利用XML模板优化查询路径的方法等。这些研究都对提高XML文档数据查询的效率作出了重要贡献,但是也都存在着自身的问题。本文在吸收前人研究成果的基础上,围绕提高XML文档数据查询效率的问题,从建立高效的索引结构和选择恰当的实现机制两方面入手,对XML单文档的简单路径查询作了进一步研究,所作主要工作及取得主要成果如下: 1、提出一种新的索引结构 本文在XML文档基本树结构基础上,提出综合利用哈希表、链接表和C-forest’结构为XML文档构建新的索引,对该索引的效率问题进行了分析。 2、提出一种新的查询方法 本文提出运用多线程机制的优势,在高效索引的基础上,自底向上,并发处理查询的解决方案。对路径表达式进行了再处理,以适合多线程机制,详细给出了这种处理策略。 3、给出所有算法的代码实现
其他文献
根据目前GIS发展的趋势和方向,管网管理系统要实现的目标主要包括:(1)实现管网基本资料的管理,包括空间数据和属性数据,提供常规的统计、查询、编辑等功能。(2)实现突发事故处理
随着数字信息技术和网络技术的高速发展,嵌入式产业迅速崛起,成为二十一世纪发展最快的IT产业,嵌入式系统蕴含着巨大的市场商机。在这种背景下,已经在服务器市场稳定了地位的
在现实世界中,我们可获得的大部分信息都是以诸如书籍、研究论文、新闻、数字图书、Web页面及电子邮件等各种形式出现的。这些形式的信息通常称为文本信息,它们由来自各种数
随着我国铁路电气化线路建设的发展及列车运行速度的提高,电力机车、电力动车组逐步成为列车的主要牵引动力和运输工具。在电力机车(动车组)整备作业过程中,如何确保人身安全
随着因特网的不断发展,图像数量与日俱增,每天都有大量的图像被添加到图像数据库中,如何有效地对海量图像进行检索显得尤为重要。基于内容的图像检索技术就是为了适应海量图像数
企业应用集成(EAI)是近年来逐渐兴起的一项技术,目的是将企业原有的多个应用系统相互连接,实现多应用软件系统的交互协作,充分利用企业的信息资源实现信息共享,消除企业IT系
J2EE是由Sun公司推出的一个支持企业级计算的Java平台,其EJB、RMI、JMS等技术及Java的跨平台性、开放性等特性使其非常适合于作为企业信息系统集成的平台,XML是一种标记语言,具
随着市场竞争的日益激烈,企业的业务过程不再是一成不变,它需要根据市场的需求不断地做出动态的调整和修改。工作流技术的出现使得业务过程更加自动、高效的执行,然而它不能
随着国内医疗体制的逐步完善和医疗市场的进一步开放,数字化医院越来越成为社会关注的热点,成为影响医疗水平,服务质量和医院竞争力的重要因素。目前,医院的HIS(医院信息系统)、L
机器人足球比赛是近年来在国际上迅速开展起来的高技术对抗活动。它是人工智能领域与机器人领域的基础研究课题,是一个极富挑战性的高技术密集型项目。本文以足球机器人系统