XML关键字查询中数据索引和查询结果排序算法研究

被引量 : 6次 | 上传用户:yanxiant
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
90年代以来,信息技术进入了一个历史上前所未有的飞速发展时期。INTERNET为用户提供了资源共享和信息交互的方便快捷的手段和平台。目前,大多数WEB上的文档是用HTML格式存放和传送的,但在扩展性、结构化和可验证性等方面的不足限制了HTML的应用能力。于是,可扩展标记语言(XML)应运而生,它是专门为WEB设计的一个简单的SGML的子集,既克服了HTML的不足,又去除了SGML中那些对于当前WEB用户来说不必要的特性。目前,XML已成为万维网数据表示和交换的标准。随着XML文档的大量涌现,针对XML文档的检索查询成为目前研究的热点方向之一。尽管基于HTML关键字的搜索引擎已取得很大的成功,但由于XML与HTML在诸多方面存在差异,若不加修改直接用于XML数据查询,则不能完全发挥XML所带来的好处。特别是在关键字搜索查询时,针对XML数据建立有效的索引机制是实现高效查询的重要手段;此外,由于关键字搜索查询有可能返回大量的查询结果,对关键字查询的结果进行有效的排序,也显得尤为重要。本论文即是针对XML数据索引和查询结果排序这两个与XML关键字查询相关的技术开展研究。针对XML数据索引问题,本文在对现有的XML数据索引技术进行分析的基础上,并通过对XML文档树进行压缩的方式,建立了Ttree变形树索引结构和相应算法。我们详细地讨论了Ttree变形树索引的数据结构及其相关算法,并对现有的XML数据索引和Ttree变形树索引进行了对比实验,通过实验验证了Ttree变形树索引的优越性。针对XML关键字搜索查询结果的排序问题,本文探讨了一种关键字搜索查询结果的排序算法ElemRank,我们也详细地讨论了该算法的每个步骤,并通过实验验证了该算法的有效性。
其他文献
本文将准噶尔盆地中部1区块中生界油气藏与车莫古隆起形成演化、残余地层分布、沉积体系,油气源、输导体系和油气成藏期次研究联系起来,综合研究油气成藏模式和主控因素,指出
回纥(回鹘)是维吾尔族与裕固族的共同祖先,其先民的历史可追溯到先秦时期。至7-8世纪时,建立了漠北回纥汗国,开始以独立的、具有较强大军事力量的一个民族共同体登上历史舞台
自主式移动机器人在移动的过程中,常会面临无法预测的环境变化,如何有效地发现障碍物并实现安全避障成了一个热点问题。基于自制的四轮移动小车,以ATMEL公司的8位单片机AT89C
该文通过对英语应用文体翻译中存在的文化背景差异、中西思维习惯不同、语法及词汇拼写错误、语言使用不当等中式英语现象的分析,提出了针对各种应用文体所采取的不同翻译方
油气勘探程度的提高、勘探目标的日益复杂促进了叠前深度偏移成像技术的快速发展。波动方程叠前深度偏移在生产中逐步得到了广泛应用。波动方程叠前深度偏移对输入速度模型的
教材始终是对外教学中非常关键的一环。本论文试图全面考察杨寄洲的《汉语教程》对各语言点的解释。本文重点探讨了与教材中列出的语言点相关的研究新成果,并思考教材的解释是
第一部分后循环缺血患者的人口学资料及危险因素目的分析后循环缺血危险因素的分布特点,从而为危险因素的筛查及预防提供更有针对性的信息。方法本研究从2004年1月至2006年6
手机作为一个快速发展的产业,充满着激烈的和竞争和风险,而该行业风险管理意识非常淡薄,项目的决策者、经营者都没有将风险管理看作是项目管理的一部分,对待风险管理的态度大多处
本文首先运用信息经济学的原理和博弈论的分析方法,将银行监管问题置于信息不对称的委托—代理分析框架内,建立了银行监管中激励问题的理论模型,分别对银行机构和监管者两个
一.研究背景滑膜炎(synovitis)是多种疾病(如创伤、风湿类疾病、关节退变、结核、色素沉着绒毛结节等)在滑膜组织方面的特定的滑膜炎症反应和共同表现。膝关节是人体滑膜最多,关节