【摘 要】
:
信息检索过程中最重要的环节就是检索出与用户需求相关的内容。其核心问题就是:对于给定的用户查询,对文档集中的每个文档与查询进行相关性判断。在这一过程中,查询表达了用
论文部分内容阅读
信息检索过程中最重要的环节就是检索出与用户需求相关的内容。其核心问题就是:对于给定的用户查询,对文档集中的每个文档与查询进行相关性判断。在这一过程中,查询表达了用户的信息需求,是信息检索过程中最为关键的数据之一,其内容准确与否直接关系到检索结果的好坏。但是,由于查询词简短且存在一词多义和一义多词的现象,往往会造成用户查询与数据不匹配,导致检索结果不佳。一种常用的解决该问题的方法是对查询进行处理,使查询更好的表达用户的意图。
目前,在搜索引擎中比较常用的查询处理方法有相关反馈和查询重构及自动查询扩展技术,而自动查询扩展技术按照使用到的文档集不同,又可分为局部分析方法和全局分析的扩展方法作为较早出现的具有实际应用价值的查询扩展方法,全局分析方法得到了广泛的应用。
传统的全局分析方法在提取扩展词时,没有充分考虑到扩展词间的间接关系,这势必会影响到检索性能。本文提出了一种基于Markov团的信息检索扩展模型,本文使用到了基于团的提取算法,团结构描述了Markov网络中多个词之间构成团的深层次关系。在计算相似度时,本文利用到了Markov网络的性质进一步表示了词间的间接关系,提高了检索性能。
本文首先通过计算词间相似度构造Markov网络模型;然后由此模型加强候选词集中词相关性描述,并提取了在Markov网络中词间的团结构;最后通过在查询中加入查询词所在团中的其他候选词进行查询扩展。在5个常用的标准测试集ADI、CRAM、MED、CISI和CRAN文档集上的实验表明基于Markov多步转移相似性的信息检索模型的检索效果优于基于一般的相似性矩阵查询扩展的检索效果;基于团提取方法的查询扩展的检索效果优于普通的基于提取方法的查询扩展检索效果。
其他文献
Web服务组合通过重用结构功能简单的服务来创建满足用户更高要求的增值服务,语义Web服务技术使Web服务成为计算机可以理解的实体,从而实现Web服务的自动匹配和自动组合。即时
随着互联网的不断发展,尤其是电子商务的出现,人们越来越喜欢在网上购买商品,并且网络购物已经成为人们购物的重要方式之一。但是,由于网络购物中消费者很难对所购买的商品具有真实的了解,消费者往往会将商品网络评论信息作为购买该商品的依据。由于利益的驱使,一些不法商家就会通过雇佣专业写手为自家商品刷虚假好评或者给他家商品刷虚假差评。为了有效的识别虚假评论,一些学者采用机器学习的方法来进行识别,并且取得了一定
视频监控的主要功能就是实时地监控场景中的运动目标,并且描述分析运动目标的行为,为更高层次的理解和决策提供辅助信息。目标的运动分析是当前视频监控中的一个重要研究方向
随着互联网应用的深入,电子邮件已经成为人们工作和生活中必不可少的交流工具。与此同时,垃圾邮件的出现破坏了和谐的网络文明,浪费大量的互联网资源和网民的时间,引起社会各
随着视频监控技术、流媒体技术以及无线网络的迅猛发展,无线视频监控正逐步走入普通家庭。为了满足广大用户可以随时随地利用智能手机监控家中情况的需求,家庭无线视频监控系
信息技术迅猛发展,计算机的应用领域也越来越广泛,已经从过去单纯的科学计算发展到了很多其他的领域,例如过程检测与控制、信息管理以及计算机辅助设计等。这就对计算机的智
在当前信息技术广泛应用的环境下,电子政务的发展同政府职能的转变一样受到高度的关注和重视。随着越来越多的政府职能最终通过电子设备和网络提供给社会,公众对电子政务系统
自E-911定位法规颁布以来,定位服务在近十年得到了迅速的发展,在人们的生产生活中得到了广泛的应用。面对3G时代的来临,定位服务必将有更广阔的市场,在提高人们生活质量的同
蚁群算法在求解TSP问题时,有陷入局部最优解、收敛速度太慢和求解质量不高以及稳定性不足等三个缺点。文章针对这三个缺点,提出了一种以基于斥候蚁实现的动态局部搜索为核心
随着宽带业务的广泛发展,流媒体服务在互联网中所占的比重越来越大,出现了大量的流媒体应用,如网络电视、体育直播、远程教育等。在传统的流媒体应用系统中,大多采用基于C/S