XML数据库中全文检索系统的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:qmail03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML广泛应用,出现了大量的XML数据。为了更好的管理这些XML数据,人们设计了XML数据库。CoSQLRX系统是一个关系-XML双引擎数据库系统,可以同时处理关系-XML查询。本文着重于XML数据的全文检索功能的研究,通过对全文检索技术的分析,提出了CoSQLRX系统框架上的XML全文检索功能的实现方式。首先,本文就全文检索的相关工作进行了介绍。介绍了XML中的全文检索的查询语法,以及与XQuery的关系,同时介绍了CoSQLRX数据库。其次,本文完成了针对全文检索中各个模块的设计,包括解析模块的设计、查询执行计划的中各个操作符的设计,同时设计了执行模块各个操作符的执行算法。再次,在分析了初步构建查询执行计划执行代价过高的基础上,本文分别提出了对应的逻辑查询执行计划和物理查询执行计划的优化策略。此外就当前XML编码中的问题进行了分析,针对原有编码在XML更新方面的不足,本文设计了DCU编码,并且就DCU编码的编码方式进行了介绍,主要包括:初始的DCU编码、DCU编码在XML结构中的表示、DCU编码的更新、DCU编码在匹配度中的应用等。同时还就设计的各个模块如何在CoSQLRX数据库当中进行的实现进行了详细的说明,包括扩展原有的语法规则、注册新的针对全文检索的操作符、在原有的执行器基础上添加新的执行器等,同时就全文检索,详细介绍了各个操作符函数的调度关系。最后,经过实验结果的对比和分析,本文设计的全文检索功能可以很好的实现在XML数据上的全文检索,设计的优化策略可以在一定程度上提高查询效率。
其他文献
计算机视觉技术得到了国内外广大学者们越来越多的关注。其中有关视频图像中运动对象的分割提取技术是最为基础和重要的一个研究方面。从视频中快速,准确的分割提取出运动目
网络控制系统是以网络为传输媒介,将空间不同位置的传感器、控制器、执行器等组成一个实时反馈的控制系统,能够实现带宽资源的共享,已较为广泛地应用在工业控制系统、电气自
多域系统是多个独立的安全系统协同工作构成的分布式系统,这种协同系统在政府、军事、商业和医疗等领域有广泛的应用。在多域环境中,每个安全系统(自治域)独立管理,通过自治
Vagueness or uncertainty is a conception associated with the set. At present, there have been many painstaking mathematical tools to solve this problem, such as
Ad Hoc网络的出现为最终实现任何人可以在任何时间、任何地点、与任何人、进行任何种类的信息交换提供了有效的解决方案[1],其在特殊环境下的作用也是有线网络和蜂窝移动网络
随着计算机的广泛应用和网络技术的迅速发展,计算机数据在人们日常生活中越来越重要,其安全问题成为日益突出的问题。与此同时,数据安全技术也在快速发展,各种数据加密软件和网络
NP-难问题是计算机科学研究中的主要研究问题之一。Garey提出了若一个问题被定义为NP-难问题,则无法用计算机进行精确求解的论断。该论断为研究人员奠定了计算难解的界限,避
随着网络技术的不断发展,Web信息资源的极大丰富,如何高效地获取互联网上的资源以及对资源的有效分析处理,越来越成为数据挖掘工作亟待解决的问题。一些较为传统的方法仍然采
计算机和网络技术的迅猛发展大大提升了以广域资源共享和协作为主要目标的网格计算在计算机科学中的重要地位。网格计算中资源的大规模共享和协作的实现是建立在网格安全基础
对大多数机器学习和计算机视觉的任务来说,选择一个合适距离度量都是至关重要的。因此,以自动设定与选取合适的距离度量为目标的度量学习(DistanceMetricLearning,DML)方法引起