XML文档查询技术研究及在数字图书馆中的应用

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:rangdeqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(eXtensible Markup Language)己成为因特网上的数据存储、交换和表示的标准。随着XML应用的普及,越来越多的数据以XML的形式存储和交换,对XML文档中的数据进行查询的要求也就越来越高。为充分利用XML的特点开展查询,本文详细研究了XML查询改进技术。MarcXchange文档是一种应用在数字化图书馆领域里的XML文档类型,可以作为通用的数据交换格式在Web环境下共享。为更好地促进数字图书馆建设,本文还详细研究了MarcXchange文档的索引和查询技术。本文的主要贡献有:1.提出了一种改进的基于LI-MOON编码的XML索引,当我们对XML编码后的索引文档进行B+树结构化处理后,能大大减少索引文档的大小,因而能有效提高查询速度。2.针对Stack-Tree-Desc算法没有利用索引改善连接效率,浏览了一些不必要的节点浪费了资源,影响了查询速度。本文提出了一种新的连接算法,通过B+树查找定位,来跳过祖先和后裔列表不必要的元素以提高查询速度。3.本文提出了一种基于MarcXchange文档的结构索引方法—Marc_index,该索引方法根据MarcXchange文档的特点采用LI-MOON编码方式,有效地实现了对文档树中任意两个结点之间祖先/后裔关系和双亲/孩子关系的检测。该索引另外的创新之处还在于有效结合B+树和倒排索引这两种方法,从而综合两者的优点,克服双方的缺陷以提高查询效率。最后,本文还提出了一个基于Marc_index索引的查询处理算法。
其他文献
微电子技术、计算技术与无线通信等技术的进步,推动了无线传感器网络的产生和发展。无线传感器网络由大量低成本、低能耗、体积小且具有一定计算能力和组网能力的传感器节点组
社区矫正是把罪犯放入社区中进行教育改造的方法,也是社区资源环境中所有改造管理罪犯方式的总称。我国的社区矫正工作是党中央、国务院在新形势下做出的重要战略部署,是创新社
近年来,图像融合已成为图像理解和计算机视觉领域中一项重要而有用的新技术,如何进一步提高图像预处理质量、融合质量和融合效率等一直是图像融合技术中的关键问题。由于图像处
步态分析对人类步态的康复指导有着非常重要的意义。稳定性分析作为步态分析的一个分支,已成为老年人意外跌倒问题中备受关注的研究热点之一。本文试图论证正常行走步态的稳定
随着全球Internet的迅猛发展,以因特网技术为主导的数据通信在整个通信业务中的比例迅速上升,因特网业务已成为多媒体通信业中发展最为迅速、竞争最为激烈的部分,各类网上应用业
针对P2P流的识别问题,本文从P2P独有的通信网络拓扑结构出发,提出了基于通信网络拓扑结构的P2P流识别模型P2P-CNTIM。P2P-CNTIM使用P2P流的多主机特征和通信对端类型特征对P2P
计算机支持的协同设计(Computer Supported Cooperative Design, CSCD)已经成为网络环境下数字化设计与制造的关键技术之一,异构CAD系统的协同设计是其中研究的一个热点。以
随着网络的飞速发展,网络应用越来越多,丰富的信息资源在带给大家便利和娱乐的同时,也在对网络带宽提出挑战。如果不对用户的网络行为进行管理控制,网络带宽势必将被P2P、IM
网络信息时代的到来、多媒体技术和微电子技术的发展,使得许多传统媒体内容向数字化转变。由于音频、视频、图像等作品都能以数字形式获得,制作完美的拷贝和恶意的篡改变得十分
安全问题是网格计算技术的关键问题之一,特别是随着网格技术的商业化发展和普及,安全问题的解决更是迫在眉睫。本文的目的就是介绍解决网格计算中的安全策略特别是访问控制方面