基于本体的信息检索研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:weiguoliaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索是从信息集合中找出与用户需求相关的信息。本体作为一种表示知识的形式,具有良好的概念层次结构,支持推理功能,因此基于本体的信息检索能给检索服务性能带来极大的改善。它能从语义角度去理解用户检索与信息源的关系,结合相应的推理规则,基于本体的信息检索系统将会是一个“会理解”“会思考”的智能体,而不再是单纯的通过词语之间的匹配实现检索任务。本文首先分析了本体相关理论,包括本体概念、作用及构建方法。然后重点介绍本体的描述语言及推理工具。其后,分析了信息检索的基本流程,说明其中主要步骤,包括文档预处理、构建索引、用户查询扩展、检索策略及排序算法。为了引入基于本体的信息检索系统模型,本文构建了无线自组织网络领域的本体库。分析构建领域本体的流程,并且结合相应工具给出了构建过程中的实现细节。在领域本体的基础上,本文提出了基于本体的信息检索系统,具体说明了相比于传统信息检索而言,它的优越性。本体作为知识的表示形式,使得用户和检索系统采用统一的语言,这样检索系统能够理解用户查询。而在本体中结合推理规则,将会使检索系统能够“思考”,给出令用户满意的检索结果。然后详细给出了基于本体的信息检索系统中涉及的核心算法。在用户查询预处理阶段,本文采用结合Jena推理机内置规则和自定义规则,获得更加完备的知识库,并使用了一致性检测功能,保证了知识库的准确性。在用户查询预处理、检索策略以及排序算法模块,充分利用了本体作为知识表示的形式的优越性。最后,在无线自组织网络领域内,实现了领域内的信息检索系统,对该系统进行了初步功能性验证。
其他文献
网页作弊是指作弊者运用各种手段欺骗搜索引擎,使网页在搜索结果中获得高于其本身应得排名的行为。垃圾网页的泛滥严重危害了搜索引擎公司、合法网站和各类用户的利益,因此研
随着飞速增加的带宽,实时和多媒体应用等网络业务的日益普及,网络拓扑结构日益复杂化,互联网从单纯的数据传输发展到同时支持多种类型信息的传输,互联网的质量评价体系也成为
互联网技术以及电子商务网站正在蒸蒸日上地发展着。近几年来,服饰商品在网上的销售量和销售额度得到了大幅的增长。但是在线购物网站带给人们的不仅仅是购物方便,同时也让用
随着多核处理器应用的普及,多核技术的发展越来越受到人们的关注。如何进行多处理器系统结构设计,以充分提高计算机性能是一个值得深入研究和探索的课题。尽管目前已经有很多
随着互联网的不断发展,网络极大的改变了人们的生活。网络上传递的信息种类越来越多,对计算机网络的数据传输技术也提出了新的要求,网络媒体分发技术也随之不断发展。P2P (Pe
随着通信技术的发展,通信传输能力已能满足更丰富的上层业务的需求。在众多新兴业务中,远程多媒体会议服务成为既符合客户需求,同时可以充分利用网络带宽的电信业务。与此同
随着通信网和互联网的发展,用户对通信业务的需求也在不断的变化。3G时代的到来,使得视频业务成为3G增值业务的焦点,用户需求也越来越便捷化、个人化、娱乐化。用户想通过手
随着网络技术的发展,网络用户与网络中流量飞速增加,需要连接网络的分布式路由器具有更快的转发速率,而IP报文在路由器FPGA (Field-Programmable Gate Array,现场可编程门阵
视频传感器网络(Video Sensor Networks)是一种由具有计算、存储和通信能力的视频传感器节点组成的分布式感知网络。节点定位是视频传感器网络进行目标识别、监控、跟踪等众
车牌自动识别系统是实现交通管理智能化的重要环节之一,研究车牌自动识别技术具有重要的实用价值。车牌自动识别系统一般包括车牌定位、字符分割和字符识别三部分。本文主要