XML引擎研究

来源 :中国科学院研究生院(文献情报中心) | 被引量 : 7次 | 上传用户:hxhbj2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML从1998年由W3C(World Wide Web Consortium)提出之后已得到广泛的关注,各行各业都在采用XML来描述本领域的信息,比如MathML、CML、VoiceML等,随之而来的问题是产生大量XML文档,应该如何管理这些XML文档就成为一个迫切需要解决的现实问题。XML引擎研究就是根据这个问题提出的研究课题。本文所做的主要工作有: (1) XML引擎原型设计。本文设计了一个XML引擎框架,研究了XML引擎与XML数据库、XML应用系统之间的关系,以及XML引擎存储系统、索引系统和查询系统的各种功能。存储系统为索引系统提供存储支持,为查询系统提供临时文件的存储,比如索引文件、索引使用的参数文件等;同时查询系统获取源数据时需要访问存储系统。索引系统分为内容索引和结构索引两部分。索引系统主要为查询系统服务,为查询系统实现全文查询、布尔查询、路径查询提供支撑;索引系统还提供一些接口,使得外部程序可以不经过查询系统也能访问索引系统。查询系统分为内容查询和结构查询两部分。查询系统遵守XPath语法,在实现结构查询功能的同时,也把XML文档看作一般的文本文件来处理,提供内容查询功能。 (2) XML索引技术研究。本文研究了对XML文档进行内容索引和结构索引的方法,尤其是内容索引和结构索引的有机结合机制。在内容索引技术中研究了三个问题,即变长记录存储问题,中文词、英文短语的索引问题,提高索引建立速度的问题。本文提出的结构索引技术采用了四个索引文件来完成对XML文档的内容索引和结构索引,研究了四个索引文件的建立方法。针对结构索引的建造,本文首先阐明了前序一后序节点标号法,然后提出了树邻接表的概念,并给出了把DOM树转换为树邻接表的办法;最后对树邻接表进行前序-后序遍历,得到每个节点的标号,并组装成结构索引文件。 (3) XML查询技术研究。本文研究了对XML文档进行内容查询和结构查询的办法,关键是研究了内容查询和结构查询的有机结合机制。本文研究了内容查询技术中的三个问题,即简单检索、字段检索和布尔检索。在研究结构查询技术时,本文提出了五种基本的路径表达式,即简单路径表达式、含序路径表达式、属性路径表达式、含值路径表达式和K C路径表达式,本文研究了这五种基本路径表达式的实现方式,通过分析这五种路径表达式的实现,笔者提出了四种针对结构信息的基本操作,即PC操作、AD操作、CO操作和OR操作。 在研究方法上,本文综合应用了文献调查方法、逻辑推理方法、归纳总结法和实证法。针对不同的研究内容,采用不同的研究方法,确保研究过程和研究结果的真实与可靠。
其他文献
你我的相遇,既是千百年修来的因果,而更多的却是我自己的选择。像我这样一个矜持的女子,从来不会轻易地主动接近任何一个异性,更何况坦露心迹,而你却是惟一的例外。
本论文通过将技术经济学中的寿命周期费用理论引入决策支持系统中,对形成的一种能适应现代化工程发展需要的决策支持系统进行了研究。它将计算机技术、决策科学和技术经济学有
随着半导体、计算机和通信等技术的飞速发展,数字化信息已经渗透到与人类生活密切相关的各个领域,人类正向高度信息化的社会迈进。目前的研究成果和发展趋势表明,有两项技术
高效的基于内容的图像检索在许多应用领域得到了迅速发展,目前图像内容检索的领域也建立了一些系统,但这些系统在实际使用中有如下欠缺:(1)这些系统期望以相同的方法处理各种不
借助虚拟组织(VO)的灵活性和动态性,敏捷企业可以灵活地通过与其他企业进行协作,抓住商业机会,达成自身目标,实现效益最大化。随着面向服务的体系结构(SOA)日益成熟并得到IT
电子实验教学是培养学生运用电路理论进行工程设计的重要实践课程,承担着支撑电子类本科生创新能力培养的重任。为了让教学活动紧紧围绕创新能力培养展开,本文将电子实验支撑的
对云南6个山羊品种的体尺和屠宰性能作了测定,结果显示,圭山山羊、马关无角山羊体型较大,龙陵黄山羊和圭山山羊产肉性能高于其它品种(P<005),云岭山羊和临仓长毛山羊的消化器官最发达(P<0
<正>产科急性弥漫性血管内凝血(DIC),是因为产科多种致病因素如羊水栓塞、产后大出血等激活了机体内凝血系统,导致广泛性微血管血栓的形成,体内大量的凝血因子和血小板被消耗
医学成像技术的迅猛发展,为现代医学的临床诊断和治疗提供了相当丰富的信息。借助计算机技术对医学数据进行处理与分析越来越多地受到人们的重视。在医学影像数据的各个研究分
目的研究丹皮炭及其止血活性部位对大鼠血小板功能和纤溶活性的影响。方法以SD种大鼠为研究对象,观察丹皮炭及其止血活性部位对4,5-腺苷二磷酸二钠盐(ADP)和胶原诱导的大鼠血