基于模糊逻辑的关系数据库信息检索方法研究

来源 :大连海事大学 | 被引量 : 7次 | 上传用户:jhyh001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系数据库关键词检索技术使得用户不需要了解任何SQL语言和底层数据库模式,就可以方便地检索到数据库中存储的信息,就像使用搜索引擎一样简单、便捷,因此关键词检索技术成为数据库查询领域的研究重点。数据库的规范化设计使得检索结果以元组级别的形式展现,这将导致检索结果不完整,语义难以理解,因此提出对象级别的信息检索技术。对象级别的信息检索技术可以直接地表达检索结果的语义,返回的结果也更加完整。但当用户输入的是具有模糊性的检索关键词时,其检索效果并不好。而模糊数学知识的引入则可以很好地解决数值型关键词的模糊检索问题。在对数值型的关键词进行操作时,首先对数据库进行分析,然后有针对性地提出隶属函数,利用隶属函数和模糊化算子对数值型关键词进行操作。在相关性排序时,通过利用模糊逻辑中的模糊推理方法来计算对象结点的权重。在对关键词检索结果进行排序时,不仅要考虑信息检索技术本身的特点,还要考虑数据库特性,主要有元组重要性,属性重要性以及属性上关键词的IR分数。数据库中各个元组/属性被检索到的次数是不同的,这就表明不同的元组/属性对用户的重要性是不一样的。在计算属性上关键词的IR分数时,采用传统的TF/IDF可以很好地得到结果,但这只限于对非数值属性的关键词,对于数值属性的关键词则很不实用。因此需要利用隶属函数对数值型关键词进行操作,进而实现对数值属性关键词的模糊检索,并有效地进行相关性排序。本文采用上述方法设计并实现了一个基于模糊逻辑的关系数据库对象级别信息检索原型系统。利用DBLP数据集对该原型系统进行了实验验证,并采用P@K和MAP两个评价指标对实验进行评价。最终的实验结果表明本文的方法能有效改善检索结果的排序效果。
其他文献
连接是数据库系统查询处理中的一个核心操作,高能效连接算法是能效DBMS中的一个重要研究议题。固态盘和硬盘比较具有随机读写性能快的优势,数据库系统中合理利用这一优势提升
随着云计算和互联网的快速发展,云计算环境下的实例密集型工作流作为一种重要的商业应用开始被广泛应用于人们的工作和生活中,如电子商务中的在线付款和网络购物等。因此,对
随着网络技术的迅速发展,电子商务活动越来越频繁,尤其是网上购物、网上银行等业务给人们生活带来了巨大的便利,人们能够在足不出户的情况下,获得自己所需要的资源和服务。但是人
软件缺陷预测是软件工程中最活跃的研究领域之一。缺陷预测模型能够提供容易出错的源代码组件或更改等,使得质量保证团队可以通过更多努力应对易出错的源代码,有效地分配有限的
下料问题广泛应用于各个行业,如金属制品业,家具业,钣金件加工业等。目前应用较为广泛的是二维矩形下料。二维矩形下料问题,是将板材材料加工成满足一定需求的矩形毛坯,在满
近年来,随着物联网技术的快速发展,作为其支撑技术之一的无线传感器网络技术也得到了迅速的发展。无线通信技术的迅速普及,使得异构系统之间的共存与干扰问题日益严重。随着ZigB
信息技术的高速发展极大地丰富了网络资源,为人们获取信息带来了方便。但是由于网络资源的逐渐增多,面对繁杂的信息,用户要找到所需的信息也变得更加困难,信息过载的问题便随
计算机技术发展给人们生活带来了革命性的改变,人们希望能够和计算机更加有效地沟通,因此,自然语言处理技术应运而生。词性标注作为自然语言处理中一个重要的基础性研究课题,具有
近年来,随着通信技术和信息技术的飞速发展,人们逐渐意识到一些数据集中型的应用。在这些应用中,数据不再是传统上基于关系模型的静态数据,而是以转瞬即逝的数据流形式出现。上述
医学图像三维可视化指的是将由高科技成像设备X Radio、CT、MRI扫描所获的2D切片图像重建出人体生理组织及器官的3D模型的过程。它在生物医学领域发挥着重要作用,像医学诊断