关系数据库CoDB中XML全文检索的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:weishuange0l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的信息化,传统的关系数据库已经不能满足人们的某些应用.在关系数据库上增加新的功能特性成为当前的主流的研究方向.例如全文检索就是数据库系统急待增加的一个功能.一旦数据库拥有了全文检索的功能,用户就可以通过SQL语句进行关键字的查询,而且可以完成聚集、连接等一系列复杂的查询.这是一般搜索引擎所不能办到的.另一方面伴随着XML逐渐成为数据交换的标准,对XML文档的查询也是当前的一个研究热点.目前主要的研究工作还是集中在对XML文档的结构化查询上,而对XML的关键字检索的工作还处于刚刚起步的阶段.结构化的XML文档为什么还需要关键字检索呢?关键字的检索有自己的特点:用户不需要知道XML的结构信息也不需要知道复杂的XML查询语言.对于普通用户来说他们更喜欢这种简单关键字的检索.因此XML的关键字检索有着非常广阔的应用前景.该文以北京大学数据库教研室开发的CoDB关系数据库为基础,在其上设计并实现了XML全文检索的功能.我们的系统有如下一些特点:●支持XML文档的检索,查询的精度可以控制,可以是在XML文档的元素Element级别也可以是在文档级别.●CoDB中的全文检索功能和数据库查询引擎句紧密地结合在了一起,用户可以完成一些较为复杂的基于关键字的查询.●设计了一种新的自索引的倒排结构可以很好的应用于XML全文检索.●支持对XML文档的重要度和XML元素的重要度排序.实验证明使用我们的全文检索进行检索时查询速度要比SQL Server快一些,而且在全文检索的功能上还要略强于SQL Server.
其他文献
随着网络技术、多媒体技术和数据库技术的跨越式发展,教育现代化和教育信息化成为了教育发展的一个重要方向."向教育要发展,向教育要效率"已成为各个部门必须面对的重要问题.
网络使人们进行信息交流和传递变得方便、快捷.然而,网络本身无法保证传输数据的安全性.因此,如何保护网络上传输数据的安全性成为信息安全研究领域的重要课题.信息隐藏学为
网络教学是现代教育发展的有效手段和必然趋势,它在实现共享教育资源、扩大教育规模、提高教育效率、构筑终身教育体系等方面具有重要作用。但由于网络的教育功能发展还不够成
人脸识别不仅是计算机视觉领域的一个核心研究方向,更是关系国计民生的一项重要技术。随着大数据时代的到来和深度学习技术的发展,人脸识别技术发生了重要突破,现在已经越来越广
随着素质教育的全面推广和中小学校信息化建设的迅猛发展和普及,中小学校的管理模式和管理手段必将发生深刻的变化。为满足素质教育管理模式和校园网络平台建设要求,我们针对吉
人力资源信息管理(HRM)是近几年来出现的一种新的哲理和技术,如何对已有的人力资源信息进行存储和管理以支持决策分析是目前面临的重大课题。开发人力资源信息管理系统软件就是以上述管理内容及其内在联系为依据而编写的计算机程序管理支持系统。它覆盖了人事档案管理、劳动合同管理、人工成本控制、统计分析等方面的内容。本文首先对HRMS国内外发展趋势进行了分析,根据企业实际情况分析了系统所采用的体系结构及相关技术
随着数字多媒体技术的飞速发展,视频采集与处理技术在众多领域有着越来越广泛的应用.当前市场上已出现多种视频采集卡,但都无法满足一些特殊的用户需求.该文所研制的数字视频
开放式与智能化是当今数控系统发展的两个方向.围绕这两种发展趋势,目前对开放式的研究进行比较多,智能化方面的研究还很少.模糊控制方法在工业控制领域已经得到广泛的应用,
通过高速网络连接起来的工作站群集系统为用户提供了累积的处理能力和巨大的数据存储空间,并且以其高性价比和良好的可扩展性越来越多的应用于高性能科学计算和事务处理中,但
随着Internet/Intranet技术的发展和普及,计算机化考试在许多方面将逐步取代传统的基于纸笔的考试。探讨和研究基于计算机网络的考试,以便能客观、准确地评估人的某种能力和水平