基于本体的新闻主题搜索研究

来源 :兰州理工大学 | 被引量 : 6次 | 上传用户:zuizui8321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,Internet发展迅速并已渗透到生活的各个角落,Internet上蕴藏着大量的各类新闻信息,传统的新闻获取方式受到极大的挑战,人们进入了一个“信息爆炸”、“新闻过剩”,而“新闻知识匮乏”的时代,通用搜索引擎在一定程度上解决了上述问题。由于Web的动态性和规模越来越大,通用搜索引擎索引数据库的索引逃逸子空间不断扩大,其查询接口也很难满足特定用户的查询请求。因此,新闻主题搜索引擎应运而生。目前,Internet已成为人们获取新闻的重要来源,如何从大量的新闻网站中准确、快速地找到所需要的新闻已成为新闻搜索引擎的首要目标,为实现该目标,本文尝试在新闻主题搜索引擎中加入语义概念,试图通过本体在语义方面的强大表达能力并借助于局部上下文信息,来增强搜索引擎的语义理解能力及查询精度。由新闻主题搜索引擎入手来研究专业搜索引擎,这种构想也会对专业搜索引擎的发展产生一定的影响。为实现上述目标,本文主要做了如下两方面的工作:1.构建新闻领域本体。首先,介绍了构建新闻领域本体的意义和策略,将软件工程学的思想融入到新闻领域本体的构建过程当中;然后,详细论述了领域本体的构建过程,并对每步都做了较详细的分析;最后,根据本文算法的需要,利用本体构建工具protégé3.3.1并参照其他领域本体的构建方法构建了一个简单的新闻领域本体。2.设计并实现了新闻主题搜索引擎,详细介绍了该系统的功能及构成模块,给出了新闻主题搜索引擎的语义检索模型。将本文提出的基于本体和局部上下文分析的查询扩展方法应用于该系统,重点论述了查询扩展方法中的语义扩展、扩展词的筛选等关键技术。最后对实验的结果进行分析并加以总结,验证了该方法的有效性。
其他文献
视频目标跟踪作为计算机视觉领域中的重要组成部分,已经广泛应用于医疗诊断、智能交通系统、弹道导弹防御以及军事制导等国民和军事的众多方面,受到相关领域科研学者的广泛关注
表情作为人类情感表达最直接最基本的交流方式,在非语言交流当中是一种十分有效的表达方式。表情不光可以直接而又准确的呈现个人的思绪情感,同时可以根据对方的表情来判断他人
随着计算机技术的发展,密码分析技术的进步,视频数据面临越来越严重的安全威胁。随着H.264视频压缩标准的问世,视频数据的安全性问题更加突出。因此针对H.264的特点,如何改进加密
计算机系统漏洞以及软件漏洞让大规模攻击成为可能。攻击者通过利用这些漏洞控制目标主机实施攻击。缓冲区溢出漏洞二十多年来在计算机漏洞中一直扮演重要的角色。因而了解什
随着无线网络技术的飞速发展,人们对无线网络性能提出了更高的要求,无线Mesh网络作为“最后一公里”网络接入问题的解决方案,越来越受到研究人员的关注。现有的Handoff关联策
随着网络技术的高速发展,高速网络技术逐渐得到普及,原来的网络安全防范技术如防火墙、入侵检测系统等,已不能满足网络安全的需要。入侵防御系统作为一种新的网络安全技术,受到网
分布式系统是规模以及复杂度不断扩大的计算机应用的主要表现形式。其中,分布式追踪系统以及分布式性能监控系统是大型分布式系统诊断异常、性能监控、保证系统稳定的重要手
无线局域网(WirelessLAN)作为有线局域网的延伸和补充,其优势在于较高的接入速率、部署方便、成本较低,但缺陷在于其覆盖范围有限;第三代移动通信(3G)有较大的覆盖能力,能够提供语音
随着计算机技术的发展,分数阶微分在数字信号处理领域所具备的优点越来越多的被人们认识到,其中把分数阶微分应用于二维图像信号的处理是一个刚刚兴起的研究课题。本文对分数阶
随着互联网技术的迅猛发展、科技知识的日新月异,人们对网络探索的需求与日俱增,在这样的情况下,Web上的站点和网页的数量呈现出以一种爆炸性的趋势飞速增加。按照获取信息的