基于本体的垂直搜索引擎研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wheatmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的不断发展,Web的信息量也与日俱增。面对如此海量的信息,如何保证信息的全面,及时和准确性成为搜索引擎领域所研究的主要课题。虽然通用搜索引擎在量上有很大的优势,但是传统的信息检索技术以关键字匹配为主,缺乏语义推理能力,容易造成信息的误检、漏检,导致在质的方面确差强人意,而当今用户的查询却正向“专、精、深”的方向发展,因此如何提高Web信息的检索质量成为目前信息检索研究领域的重要课题。垂直搜索是给某一特定领域提供有一定价值的信息和相关服务的,而本体正是对领域知识概念、关系、属性的抽象和描述。因此,本体与搜索引擎结合,成为研究垂直搜索引擎的重要手段。于是如何构建合理的领域本体,如何将本体理论与垂直搜索技术相结合就成为了研究的焦点。本文首先介绍搜索引擎的基本概念和原理,重点分析了垂直搜索引擎的关键技术,包括专业网络蜘蛛、结构化信息抽取以及语义标注;接着介绍了本体的相关理论及概念,阐述了本体与垂直搜索引擎相结合的意义和必要性,并结合实例进行了可行性论证。本文所完成的工作主要有:以Protege作为本体编辑工具,OWL作为本体描述语言建立了计算机配件领域本体;研究了基于本体的垂直搜索的关键技术,结合网页相关性算法,提出了一种基于本体的专业网络蜘蛛系统框架:运用计算机配件领域本体对预处理后网页文本信息文档进行本体语义标注,并以此为基础,对文档内容进行结构化信息抽取;接着以计算机配件领域本体为基础对用户查询进行本体语义扩展,着重探讨了不在本体体系当中的普通单词查询的解决方法。最后给出了本体与垂直搜索引擎相结合的系统实例,开发了基于计算机配件领域本体的垂直检索的实验系统,给出了本体在垂直搜索关键技术中的应用方法以及实现过程,通过系统运行和实验数据分析,得出实验系统比传统的基于关键字的查询方法具有更高的查全率和查准率,因此研究基于本体的垂直检索具有很强的理论和实际意义。
其他文献
分布式拒绝服务(Distributed Denial of Service,DDoS)是由拒绝服务(Denial of Service,DoS)发展而来的一种攻击手段,通过耗尽网络和服务资源的方式,达到阻碍正常用户使用服
三维重建的工作主要分为两个方面,一方面是空间位置重建,也就是几何重建;另一方面是外观重建,也就是纹理重建。对于前者,目前的手段发展相对成熟;对于后者,作为三维重建的一个
近年来,RFID技术已广泛应用于生产、物流、交通、运输、医疗、防伪、图书管理、设备跟踪和资产管理等领域。但由于外部环境干扰和射频信号的不稳定性,RFID阅读器所产生的数据
硬度是材料的重要力学性能指标之一,它表示材料表面抵抗局部塑性变形和破坏的能力。近年来,随着人们不断深入研究与应用,硬度的检测在很多方面都取得了可喜的进展,研究出了几
近年来,计算机硬件的飞速发展为计算机仿真的发展提供了坚实的基础,计算机仿真已经在很多的领域得到了应用,成为对许多复杂系统进行分析、设计和评估时不可缺少的重要手段。
随着网络信息资源的急剧增长,人们越来越多地关注如何快速有效地从网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。 搜索引擎(SearchEngine)网站
移动通信技术的蓬勃发展,给移动计算环境下的各项应用带来了前所未有的机遇,传统互联网上的各项应用纷纷向移动互联网迁移,但简单的迁移远远跟不上需求的增长,移动互联网上需
人脸图像质量对人脸检测,人脸识别等各种与人脸图像相关的系统的执行性能具有重大的影响。人脸图像质量评价与传统的图像质量评价有很大的不同。本文针对人脸图像质量评价所
随着计算机技术的发展、计算机网络的普及和教育信息化水平的提高,国内众多高校创建了网络教学平台,但其主要功能是网络教学,不是专门的课程考试平台。为了适应新型的教学考
现代的媒体教学论和建构主义教学理论强调学习是学习者和环境之间的相互作用,并且环境对获取知识的意义构建有非常重要的意义。虚拟现实技术作为在网络技术和多媒体技术之后