关系数据库对象级别检索结果相关性排序算法研究

来源 :大连海事大学 | 被引量 : 10次 | 上传用户:dmjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,网页搜索引擎获得了巨大的成功,用户可以用简单的关键词找到自己需要的信息。而关系数据库是当前数据库的主流形式,它采用结构化查询语言进行内容检索,并要求用户掌握一定的查询语言和数据库模式知识。由此就产生了一个很自然的需求,让关系数据库支持高效的关键词查询,因为关键词检索可以使用户摆脱SQL语句的束缚。相比于网络搜索引擎,关系数据库关键词检索又有了新的特点,例如:元组之间拥有语义关系;数据库中的属性值隐藏着等价和传递关系;数据库中的文本都是短文本等等。因此一些信息检索的方法仅是在关系数据库上进行元组级别的关键词检索,并不适合于关系数据库,需要研究一种适合于关系数据库本身特点的相关性排序算法。本文针对关系数据库的特点以及信息检索的特点,研究了一种对象级别的相关性排序算法。解决了元组级别检索排序的信息分散问题。本文的技术路线是:首先对关系数据库构建全文索引,按照模式图对数据库的元组进行信息整合,得到需要的对象;接下来在构建好的对象上进行关键词检索;最后针对检索出的结果进行相关性排序。本文提出的相关性排序算法首先需要发现属性值之间的传递关系。一个属性值出现的次数越多,属性值与关键词的联系越紧密,利用信息熵的方法为属性分配权值。信息熵的大小与数据分布的情况有关,可以通过计算信息熵来反映当前属性值分布的情况,找到属性值与关键词的相关情况,得到信息检索的相关性得分。其次需要考虑每个对象本身的结构特点。包括对象中的元组和元组之间的边的情况来得到数据库结构相关性得分,由两者共同得到相关性得分。本文采用上述方法设计了关系数据库对象级别检索结果相关性排序的总体框架,并实现了该算法。以手机领域的数据表为数据集对该算法进行验证,其结果证实了该算法的可用性以及算法的可行性。本文的排序过程不仅能得到包含关键词的对象信息,而且可以区分包含相同关键词的对象之间的差别;与传统的关键词检索排序算法相比,本文使用的方法能有效改善关系数据库关键词检索排序的效果。
其他文献
牵引变流器是轨道交流牵引传动控制系统的核心,它的性能直接影响到了车辆运行的性能。然而,轨道牵引变流器的功率较大、开关频率低、工作环境恶劣等问题,在控制上存在很多难
21世纪的教学是信息化的教学,很多学校教师纷纷认识到传统初中语文阅读教学那种过分强调教科书、忽视学生自主权、和生活实际脱离的教学已成为提高教学质量的拦路虎。语文教学
德米特里·德米特里耶维奇·肖斯塔科维奇(Dmitri Dmitrievich Shostakovich 1906-1975)是二十世纪苏联著名的作曲家、钢琴家、社会活动家,他是二十世纪最伟大的交响乐作曲家
在人类的生活交流中,“句尾省略”表达方式是一种非常重要的语言行为。基于这种认识,中日两国越来越多的学者开始关注于“句尾省略”表达方式的研究。不过,大多数都是关于“句尾
在传统经济学模型中,人们的行为通常被假定为理性的。但是,经过大量的心理学实验研究发现,人们的心理往往会偏离理性假设,即有过度自信、羊群效应等相关的心理偏差。而正是由于传
改革开放以来,我国经济发展取得了举世公认的巨大成就,但是城乡“二元”经济社会结构中仍然存在着如城乡差距拉大、农民收入增长缓慢、“三农”问题更加突出、就业压力增加、生
钛酸铋钠(Bi0.5Na0.5)TiO3是一类重要的ABO3型钙钛矿结构无铅压电材料,它又可以细分为六方结构和四方结构两种类型。钙钛矿结构功能材料作为一类很重要的基础材料,已经广泛用
我国目前处于城市化快速推进期,城市建设用地供需矛盾日益突出。一方面,城镇人口不断增加,城市建设用地面积急速扩张,另一方面,农村建设用地特别是宅基地粗放利用,浪费严重,结果导致
顶部驱动钻井系统(Top Drive Drilling System,简称TDS)自1982年诞生以来,在海洋和陆地钻机上都得到了广泛的应用。与常规的钻井装置相比,顶部驱动钻井装置更加安全可靠,特别适合于
对“生活世界”的话语的提出和关注,在西方哲学史上有着极其重要的意义,可以说是转换了自笛卡尔以来的以数学化、客观化为特征的认识论和方法论的思维视角。胡塞尔是就生活世