基于Markov概念的信息检索模型

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:xike68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web信息资源的迅速增加,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,是个迫切需要解决的问题。由于自然语言的模糊性和用户信息需求的随机性和动态性,导致检索效率低下。因此查询扩展技术是不可避免的。查询扩展是提高检索效率的有效方法。在一般的查询扩展中,和查询中某个查询词关联较强的词就被选了出来,但是,查询概念却很少被考虑进来。事实上,只有和整个查询主题相似而不是与单个查询词相似的这类词被加入到查询中,才更有益于查询效果的提高。因此本文提出了基于Markov概念的信息检索模型。Markov是一种较好的表示知识关联的图形表示方法,可以从实例数据来训练获得,并且它的无向性能更好地解释信息检索中知识之间的关系,具有强大的学习功能和推导能力。本文通过对文档集的学习,词与词之间相关性被提取出来,从而构造出Markov网络,把从Markov网络中挖掘出来的概念加入到检索模型中。试验表明:我们的模型在很大程度上提高了检索效率。本文的创新点在于:1.本文是把从Markov网络中挖掘概念的具体表达形式-团和Markov概念图加入到检索模型中。基于团的Markov网络信息检索模型使得词与词之间的简单相关性更加强化,把团作为一个概念整体加入到查询扩展中。而基于Markov概念图的信息检索模型则是重点考虑查询词之间的依赖性,把查询层的相关性传递到索引项层。在查询过程中加入候选词修剪技术,一些噪音词被剪去,而与查询主题相关的词被扩展进来,从而有利于检索效率的提高。2.通过试验验证和分析了基于Markov概念的信息检索模型的性能,并与一些常用的检索模型算法及已有的Markov网络信息检索模型的性能做了比较。本文提出的模型表现比较优异,在很大程度上提高了检索效率。其中基于Markov概念图的信息检索模型性能最优,同时还能降低检索的计算量。
其他文献
嵌入式系统的Internet网络化的研究与应用是近几年来嵌入式应用领域的一个研究热点。全球信息资源的全面共享是今后发展的潮流,与人们生活、生产关系最为密切并拥有着无尽的
网格代表了一种先进的技术和基础设施,是继Internet之后的又一次重大的科技进步。基于Internet的网格,时时都面临着安全隐患,网格由于其自身的特殊性,它除了应用已有的网络安全技
伴随着网络的迅猛发展,管理信息系统的开发在市场中占有的分量越来越大。但在管理信息系统开发中,重复代码的编写工作是一件繁琐的体力劳动,例如建立大批量数据库表、生成系统界
随着微电子与通信技术的发展,无线传感器网络在军事、环境监测等领域有着越来越广泛的应用。在现有的研究中,提出了许多的模拟器对传感器网络进行模拟,这些模拟器大大方便了开发
移动的无线自组织网络MANET(Mobile Ad hoc Network),是由带有无线收发装置的移动终端组成的一个多跳的临时性自治系统。Ad hoc网络技术不但在军事领域中得到充分利用,还在紧急
学位
软件过程自提出以来,一直被认为是解决软件危机的重要手段。软件过程评估最为改进软件过程的基础,软件过程评估方法受到越来越多研究人员的关注。软件过程评估已经称为制约软
P2P网络的开放性和匿名性使得任何终端都可以加入网络并共享资源和服务,从而导致网络中存在大量的只消费资源、不共享资源的节点和提供虚假资源、不可靠服务的节点。建立节点
基于历史项目的数据挖掘是近几年来软件项目风险分析领域的研究热点,但目前常用的数据挖掘方法难以免受软件项目级的风险分析中存在的样本量有限和模型复杂的不利因素的影响并
当前的WebGIS系统普遍存在数据可重用性差、客户端通用性差、对平台的依赖性强、开发复杂度高等问题,迫切需要引入新的技术来进行改进。目前计算模式和程序设计模式领域己经发