基于本体的智能搜索引擎研究与应用

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:marcomak99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的不断发展,网络信息资源也与日俱增。面对内容冗余、结构复杂的知识海洋,如何准确、及时、全面的获取所需要的信息,成为人们所关注的焦点。传统基于简单关键字匹配的搜索技术已经不能满足用户日益增长的需求,本体作为一种能在语义和知识层次上描述信息的概念模型,具有良好的概念层次结构和对逻辑推理的支持,基于本体的语义检索技术已经成为国内外学者研究的热点。本文首先讨论了国内外语义检索的进展情况,对传统搜索引擎原理、分类、评价标准以及存在的缺陷、不足进行分析。其次,在本体相关理论研究基础上,结合领域本体构建策略,实现了家电领域本体的构建和存储。再者,对当前制约语义检索发展瓶颈的语义标注技术进行研究,通过对当前语义标注方法、工具的分析,开发一款领域本体标注工具AnnTool。最后,结合家电领域本体以及语义标注技术,提出一种基于领域本体的搜索引擎框架,并且进行了简单实验验证。该框架包括领域信息采集、预处理、语义索引、查询扩展、结果重排5个模块,其中在领域信息采集模块,通过对目前爬虫采集策略的分析,提出一种基于内容领域相关度和超链接分析相结合的网页信息采集策略,并给出对应的采集网页综合价值评价公式;预处理使用AnnTool完成文档信息语义标注;语义索引实现元数据索引;查询扩展利用本体框架对查询条件进行推理扩展;结果排序采用文档价值、文档本体匹配相似度权值以及Lucene评分机制相结合计算文档得分进行排序。通过实验分析表明,基于本体的搜索引擎比传统关键字匹配搜索具有更高查全率和查准率。
其他文献
由于现代机械设备变得日趋复杂,为了降低设备的故障风险,保证其稳定运行,状态监测与故障诊断技术得到了迅猛的发展。近年来随着嵌入式技术的融入,分析诊断仪器开始向着结构轻
P2P网络是当今互联网上最重要的应用系统之一,主要用于协同计算、分布式存储和文件信息共享等领域。然而,P2P网络因其开放性以及节点的匿名性和自治等本质特征,使其存在大量联合
随着计算机技术和通信技术以及的发展,嵌入式系统已经广泛地渗透到科学研究、工程设计、军事技术、各类产业和商业文化艺术以及人们的日常生活等方方面面中。国内外各种嵌入
虚拟机管理器VMM(Virtual Machine Monitor)提供了一个硬件抽象层,将物理资源映射到上层多个客户操作系统中。当前,基于虚拟化的服务部署,已经成为一种趋势。在这个背景下,对虚拟
随着网络技术和信息化处理的空前发展,互联网已经成为人们用来发布和获取信息非常重要的渠道之一。企业也逐渐丢弃传统调人力密集型的、成本高、效率低的管理模式,于是企业办
asterisk是一款电信领域内优秀的开源软件,主要基于Linux操作系统实现,完成了各种IP PBX的功能。其灵活,免费的特性受到越来越多用户的表青睐,为许多电信运营商减少成本带来
随着IP网络带宽的持续提升和所承载流量的急剧增长,网络流量监测的难度和复杂度也越来越高,传统的基于准确实时的IP网络流量监控技术已经不能满足要求。为了保障并提高现有网
随着嵌入式系统的广泛应用和不断发展,特别是嵌入式设备与网络的结合,嵌入式系统安全问题愈发突显,已成为目前急需解决的关键问题之一。操作系统是嵌入式系统的核心,其安全性
随着计算机网络的发展与普及,内部网的安全性越来越受到人们的关注,加强对内部网主机行为的监控和控制是解决问题的关键。本文通过分析Win32平台下的数据包捕获和解码技术,提
对于运动目标跟踪系统,其核心主要包括两个部分:一是运动目标的检测与提取;二是运动目标的跟踪。运动目标的提取是目标跟踪任务最为关键的部分。在运动目标检测方面,主要包括