基于语义本体的信息检索方法的研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:dulcimerqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,互联网的信息量以指数方式增长,Web已经成为了信息的海量数据库。互联网为用户提供了良好的信息源,但是,如何快速、准确的从这个信息库中获取需要的信息却成为了一个棘手的问题。信息检索技术,尤其是Web信息搜索引擎的产生,给用户获取信息带来了方便。但是当前主流的信息检索技术主要还是以基于关键字进行检索,注重搜索算法的研究,相对忽略了对语义的支持。互联网信息格式异构性、语义多重性和信息关系不统一,给信息管理和信息获取造成了极大的不便。虽然当前的搜索引擎已经在技术上做了很大的改进,使用了自然语言处理技术、数据挖掘等技术来提高检索的效率,但是从整体来看查全率仍然不高。语义网模型的提出使得信息检索有了新的发展方向。为了提高检索的查全率,本文在研究分析了基于本体的相关信息检索方法的基础上构建了一个基于本体的信息检索框架,提出的基于本体的局部语料分析查询扩展技术。基于本体的局部语料分析查询扩展技术是在基于局部语料分析的查询扩展方法的基础上结合本体技术的改进方法。本体对领域信息的知识化表示使得该技术能够实现对语义的支持,优化了原方法进行局部文档分析的过程,提高了文档分析的效率。在本体技术和局部语料分析方法的双重保证下,本文的方法提高了扩展结果的准确性和相关性。为了更好的提高基于本体的局部语料分析查询扩展技术的效率,本文对本体模型进行了相应的优化,对本体中概念间、实体间的横向联系进行了处理,以消除本体模型中的网络状结构,使本体保持清晰的树状层次结构,这样不仅能够降低本体模型的复杂度,而且使本体结构清晰、概念间关系明确,使得概念相似度的计算也更加简便。在处理文档的过程中本文使用了分层向量空间模型,对分层向量空间模型进行分析后指出了模型原计算公式的错误,进行针对性修改后提出了本文的计算公式。本文最后设计了实验来验证本文提出的检索框架以及相关方法的有效性。本文构建了一个田径项目实验本体,并从网络选取了60个相关新闻作为实验文档。经过文档处理,用本文的基于本体的局部语料分析查询扩展方法对用户检索请求进行处理后,在本文构建的检索框架中进行检索。检索结果显示,本文提出的基于本体的局部语料分析的查询扩展技术对用户查询关键字的扩展结果覆盖面广且相关性高,最终检索得到的文档相关性也高。实验结果显示本文的方法达到了预期的效果,提高了检索的查全率并且又不失查准率。
其他文献
本体是一种重要的知识表示形式,它是共享概念模型的明确的形式化规范说明,并在语义Web、知识工程、软件工程、生物医学信息学和社会化网络等领域中得到广泛应用。然而,本体创建
虚拟内窥镜是计算机技术在医学领域的典型应用,它利用医学影像作为原始的数据,结合虚拟现实技术、计算机图形学、图像处理、科学计算可视化来模拟传统光学内窥镜,是一种非侵
在需要知识共享的语义网中,本体是解决语义层次上的信息共享和重用的基础。本体编辑器作为对领域知识建模的必要工具,能帮助领域专家完成对本体的创建、解析、存储和重用等工
随着信息产业的急速发展,迎来了大数据的时代。网络中数据量的剧增给已经成熟的网络结构提出了巨大的挑战。云计算是依托成熟的虚拟化技术,从网格计算、分布式计算和协同计算
现在的社会是高速发展的社会,日益发展的科技,伴随着越来越多的信息流通,大数据便是这个时代的产物。大数据的价值并不在“大”,而在于“有用”,数据中的价值含量、挖掘成本
无线传感器网络(Wireless Sensor Network,WSN)是嵌入式技术、无线通信技术、传感器技术等多种技术的融合,它是一种由多传感器节点通过自组织形成的监控网络。随着其技术的不
异常检测可视为非平衡分类问题,因此可借助解决该问题的方法来实现异常检测。近年来,对非平衡分类问题的研究在模式识别领域受到了广泛关注,并已取得了显著进展,相关成果已用
别名是C/C++程序的典型特征之一,通过别名分析可以提高数据流分析的准确性并且将有助于构建性能良好的程序分析工具。本文在综述别名分析的作用及研究现状的基础上,对别名信
无线传感网络是通过多个小型、低价、智能的传感器组成的监测网络,被广泛应用于医疗、军事、科研等领域。无线传感网络给生活带来便利的同时,我们也不得不关注传感器节点自身
随着信息技术的发展,人们对信息的安全性的要求越来越高,传统的身份识别方法已经不能满足社会发展的需求。在这种情况下,掌纹识别技术就随之诞生了。本文对掌纹图像的定位和