基于本体的语义垂直搜索引擎研究

来源 :北京交通大学 | 被引量 : 6次 | 上传用户:iovewpycoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎作为获取因特网上海量信息的重要手段,是信息检索领域重要的研究课题,随着信息技术的不断发展,因特网上的信息量也与日剧增,内容庞大,组织松散。因此如何优化搜索引擎在该领域备受关注。垂直搜索引擎作为针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,通用搜索引擎的性质决定了其不能满足特殊领域,特殊人群的精确化信息需求服务。本文研究了本体和垂直搜索引擎技术,提出了一种基于本体的语义垂直搜索引擎,建立了语义查询扩展方法,并对Lucene原有结果排序算法进行优化。本文研究了垂直搜搜引擎的基本概念和设计理论,本体相关知识以及其在信息检索方面的应用,分析了国内外搜索引擎的现状以及存在的不足,以及本体技术与垂直搜索引擎相结合的意义和必要性。在对目前主要的本体构建方法进行分析比较后,选用Protege3.4.5作为构建本体的编辑工具,OWL作为本体描述语言建立了一个数码产品领域本体。运用数码产品领域本体将用户的查询请求划分为本体类概念,本体实例,本体属性和普通查询,着重研究了本体实例和普通查询的扩展方法,对于本体实例从继承关联和路径关联两个方面进行扩展,对于普通查询采用基于词语共现的语义查询扩展方法,提出了一种基于本体适合垂直搜索引擎的语义查询扩展算法。为了克服Lucene原有结果排序算法只考虑关键词和网页相关度不能反映网页本身重要程度的缺点,提出引入基于链接分析的PageRank算法对其进行优化。最后实现了基于本体的语义垂直搜索引擎原型DPOVSE,设计了相关实验,并与原有的查询方式和排序算法进行了实验对比分析。实验结果分析表明本文的研究内容可提高搜索引擎的查准率。
其他文献
随着信息技术的飞速发展,E-Learning学习成为人们在日常生活中经常使用的学习方式之一。由于近年来个性化教学的需求,在E-Learning的研究领域中,基于学习者的学习服务已逐渐
目前,XML已经成为Web数据存储、表示和交换的重要标准。XML具有良好的可拓展性与开放性、较高的压缩比、能够保证数据的结构完整性等诸多优点,但同时它也存在冗余信息多、分
非结构P2P网络由于取消了中央目录服务器,可有效解决网络结构中心化的带来的瓶颈问题,具有较好的网络可维护性和容错性。但同时由于资源的完全分布性和网络的动态自组性,也使
随着半导体工艺尺寸的不断缩小和芯片集成度的提高,VLSI电路的测试面临着许多严峻的挑战,其中,测试功耗已经成为VLSI电路生产测试中的关键性问题。电路在测试中的功耗比功能
近年来,低压电力线作为通信媒介传输数据的技术被广泛地研究,并已经成功应用于自动抄表、智能楼宇和路灯控制等工程中。由于低压电力线最初的设计是以传输电能为目的,电力线
近些年来,支持向量机(Support Vector Machine)技术作为一种机器学习的方法得到了越来越多的研究与应用。本文意在以支持向量机技术为基础进行三个方面的扩展应用研究,包括使
随着虚拟现实技术的发展以及语义Web技术的应用,基于语义Web的虚拟现实技术,即语义虚拟环境技术,是虚拟现实领域才刚刚开始的一个研究方向。语义虚拟环境的研究提出以丰富的
伴随着互联网的快速发展,Web上出现了大量的社区。社区可以代表Web的社会活动,将Web组织成社区的形式,可以使用户了解互联网中资源的组织形式和信息的发展趋势,而且可以通过识别
针对农田草害的严重性及喷施除草剂所附带的污染等问题,研究高效可行、降低环境污染的智能除草方式成为当前的研究热点,在节约、环保的同时有利于农业的可持续发展。智能除草
如何对有限元模型进行合理有效的简化一直是有限元建模的难点。本文在全面综述现有模型简化技术的基础上,结合模型的几何属性及有限元软件的网格剖分特点进行了模型简化策略