基于本体论的个性化信息搜索系统研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xiaoqiudyy1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全文检索式搜索引擎越来越成为用户使用互联网的重要工具,它的技术直接来源于信息检索领域,并根据互联网的特点进行了大规模的改变。然而由于互联网本身的涉及学科众多,用户层次多样,随着互联网数据量的急剧增加,现有搜索引擎技术越来越不能满足用户的要求,在搜索结果中与用户搜索目的无关的网页比例不断增加,而用户很难在结果中顺利找到目标网页。 现在的搜索引擎不仅局限于简单返回数据库检索结果,还对这些结果进行再加工,判断哪些最符合用户搜索意图,然后优先排列最匹配的网页。这便是被称为搜索引擎“第一定律”的相关性原则,排序算法的效果直接影响了搜索引擎的使用效率。然而通用搜索引擎统一的返回结果无法满足不同用户的要求。 全文检索式搜索引擎是基于关键词匹配技术的,然而自然语言中存在多义词、近义词、同义词的现象,而且用户提供的关键词并不一定存在于目的网页中,因此关键词机械匹配技术并不能达到应有的查全率、查准率要求。而与英语不同,汉语不存在天然的分词标记,这更加降低了搜索引擎的查全率、查准率。 为更好地解决上述两个问题,业界一直在概念检索方向投入大量精力,然而在人工智能领域尚未发生重大突破之前,概念检索并不能得到很好的查询效果;矢量空间模型方法由于速度快、准确度高,成为当前搜索引擎用于判断结果网页相关度的一项标准技术。 针对以上两个问题,本文提出了一种基于本体论的解决方法,设计并实现了面向用户的智能信息搜索系统。本方法的基础是用户的目标网页中并不一定含有用户指定的关键词,而且通过其它关键词也一样可以得到用户的目标网页。搜索系统跟踪用户平时浏览的历史网页,形成静态本体,即个性化的关键词相关度数据库;在用户提出查询请求时,智能信息搜索系统根据静态本体,把用户关键词转换为动态本体,即搜索引擎所需的系统关键词,并调用元搜索引擎进行查询,之后把根据相关度排序后的结果网页提交用户,
其他文献
近几年来,伴随着Internet的发展,Web应用急剧增加,且变得日益复杂,极大地影响了人们生活的各个方面。商业的Web应用正逐渐成为企业的核心应用,因而Web应用的质量和可靠性也渐
网络技术的快速发展和网络应用环境的不断普及,加大了人们对网络的依赖性,同时也带来了日益突出的信息安全问题。过去采用的传统的加密和防火墙技术已经不能完全满足安全需求,入
软件设计模式是可复用面向对象软件的基础,它以系统化和规格化的方式记录了可重复使用的软件设计方案和经验,能够很好地指导软件设计过程,对提高软件设计的质量具有重要意义。 本文对 J2EE 平台下的 MVC、Service Locator 和 ValueObject 等模式进行了较深入的研究,对 ValueObject 模式进行了改进,并将这些模式应用于 J2EE平台下人力资源管理系统的设计与开发中,很
最近十年来全世界网民的数量呈现快速增长的趋势,截止2011年1月全世界网民的数量已经超过了20亿。在线用户规模的急剧扩大使得用户在线行为分析在很多研究领域的意义显得越来
本文在分析国内电力企业深化改革以及国内外电力管理信息系统(Management Information System,以下简称MIS)应用现状的基础上,结合杭州市电力局生产运行管理的实际情况(电力
本文给出了一个知识推理的框架-知识框架,在该框架下变量忘记作为一基本操作,智能体可用其来对自己或其他智能体的知识进行推理.在该框架下,最弱充分条件起作重要作用.给定一背
近些年来3D数据的应用得到了极大的发展,尤其是像游戏、计算机辅助设计等应用的普及使得人们在享受这些应用来到的方便绚丽的同时也开始慢慢关注这些3D数字技术背后的支撑技术
在因特网发展的初期,网络应用主要集中在电子邮件、文件传输等传统应用,它们对服务质量QoS(Quality of Service)不敏感。随着因特网中各种技术的迅猛发展,一些新型移动业务不
随着网络的发展,网络复杂性和异构性的特点日益突出,网络管理已成为网络系统运行好坏的关键,而网络的拓扑结构发现是网络管理的基础。传统的子网拓扑发现主要依赖于ICMP协议
本文以供应链管理软件的研究开发为背景,从中抽象出面向构件的软件开发的一般过程、原理和方法。首先介绍构件化软件开发的思想,阐述了基本概念以及建模机制;接着,阐述模型驱