关系数据库的关键词检索技术研究

来源 :中南大学 | 被引量 : 9次 | 上传用户:sun18903827600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统上,SQL是存取关系数据库中数据的主要界面。但是,对于没有经验的用户来说,学习复杂的SQL语法是一件困难的事情。实现基于关键词的关系数据库信息检索,将使用户不需要任何SQL语言和底层数据库模式的知识,就像使用搜索引擎一样来获取数据库中的相关数据。关系数据库的关键词检索技术已经成为目前数据库领域中的一个研究重点。本文深入研究了关系数据库的关键词检索的检索机制和关键技术,包括检索系统框架、系统模块、数据模块、查询语言和Top-k排序及查询结果提交。通过对相关系统的检索实现策略分析,对基于关键词关系数据库查询进行形式化定义,基于给出的关键词检索的完整性约束和假设及问题模型,本文建立了关系数据库的关键词检索的数据模型和查询机制,进而建立起关键词检索的系统框架。本文通过对已有关键词检索的语法进行分析,设计了新的关键词检索语法及其识别分解算法,并给出了元数据的关键词查询方法;根据数据库关系属性的分类,分析了数字属性和文本属性的等值查询和模糊查询,给出了数字属性的等值查询的关系元组评分算法和基于隶属函数和模糊化算子的模糊查询评分实现方法,并基于简单的加权评分策略给出了数字属性的等值查询的关系元组评分算法和基于Rocchio算法的模糊查询评分实现方法。通过建立评分表和评分表图,进而相邻拓展候选元组连接树。本文通过分析已存在的排序方法及原理,提出了新的基于虚拟文档模式的最优化使用非单调函数的排序方法,并考虑其它的结果的完整性及分类因素,使用调整参数把AND和OR等关系操作符也加入到了排序模式中。把应用的IR排序方法改成把不同数据库元组结果连接起来的排序方法。排序函数的非单调性弥补了以前的方法Top-k查询处理技术不可运用于实际的不足,大大减少不必要的数据库访问,显著提高了搜索结果的查询效率。基于给出的系统检索框架,本文实现了一个关键词检索原型系统,采用多层实现关键词检索,并对文本属性和数字属性及Top-k查询的影响因素进行了实验分析,给出了这2类属性的模糊查询的主要影响因素分析。结果表明,文本属性和数字属性的相关查询方法在系统负载和效率等方面是有效的。
其他文献
教学工作一直是“职业技术教育”的中心任务,学习是学生的第一要务和主导活动,课堂无疑是决定其知识构成的一个重要因素。本文是在调研和思考的基础上,从创新角度提出几点建
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
自上世纪90年代起,信息隐藏逐渐成为信息技术领域一大研究热点,信息隐藏的目的是为了掩盖机密信息存在的事实,隐写分析则是在已知或未知嵌入算法的情况下,从观察到的数据检测
斜拉桥在公路、城市桥梁中已越来越广泛的被采用,然而斜拉桥的各种损伤如拉索腐蚀或断裂、主梁损伤、基础变位等导致的桥梁破坏事故也日益凸显,严重影响了桥梁的正常运营。研
贫金属星一般指形成于宇宙早期的年老恒星,近几年观测发现的几颗极贫金属星,推测其年龄与银河系年龄相近。通过研究它们的锂丰度可以为银河系及早期恒星的形成与演化研究提供观
<正>由陈忠实先生历时六年创作的小说《白鹿原》,凭借着其独树一帜的审美境界,被大量读者争相传阅、购买,成为中国现当代文学中的经典之作。该小说以白嘉轩为叙事核心,以反映
随着信息技术发展和应用的不断深入,信息安全越来越被世界各国所重视。信息隐藏技术是近年来信息安全领域的一个研究热点,它在数字媒体的版权保护,隐蔽通信等都有着广泛的应
恋爱、结婚、繁衍是人类社会普遍现象。每个时代对应每个时代的社会思潮,随着时代不同,社会思潮自然也不同。在不同社会思潮的影响下,青年大学生的婚恋观也随之发生变化。本
目的:探讨与孕期贫血发生有关的膳食摄入情况及营养因素。方法:2014年1月—2014年12月在中日友好医院产科建立产检档案的1 028名单胎初产妇,分别在孕早期(孕8~12w)、孕中期(孕13~2
物理核心素养导向下问题的设计是课堂有效性的一个重要因素,也是一种体验式探究学习,能培养学生自主学习探究问题的意识,对实现学生学科核心素养的培养、提高学生素质育人价