基于用户反馈的智能查询扩展技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:tshy65655
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网信息技术的不断发展,它已经成为人们获取信息最重要的途径之一。而海量、异构、复杂的网络信息的存在,使人们快速准确地获取所需信息变得更为困难。搜索引擎作为互联网信息技术的一个重要分支,可以让人们更有效地获取所需信息。虽然现有的搜索引擎已能满足用户大部分的检索需求,但仍然存在有一些问题有待优化,如由于用户未能很好地组织查询以准确表达查询需求,使查询与文档索引之间不匹配,并造成检索结果准确率低等问题。本文研究的查询扩展技术是解决该问题的有效方式之一,主要的工作包括以下四个方面:通过实验分析相关的查询扩展算法,如基于LSA、Ontology、ESA、Rocchio、Ide、Ide-dec、LCA、LA、LOCOOC、Apriori、NNLM、KLD、CHI1、CHI2等技术的查询扩展算法,并进行各个算法之间的可融合分析、加权组合设计、参数调优等工作;通过对相关查询扩展算法的研究分析,本文提出了一种基于文档重排序的混合查询扩展算法,该算法首先在用户对初次检索提供反馈信息的基础上,通过所提的策略对初检文档进行重新排序,然后使用混合的查询扩展算法对重新排序后的前n篇文档进行分析;在OHSUMED数据集上进行多组对比实验,验证了本文提出的基于文档重排序的混合查询扩展算法能有效提高检索性能,其在平均准确率MAP等指标上较一些已有查询扩展算法有一定的提高;将提出的查询扩展算法应用于已有的一些搜索引擎中,其主要基于Google和Bing开放的API实现,首先用户交互式地提供反馈信息,然后应用本文提出的方法进行查询扩展分析,最后扩展出一些词语到初始查询中自动进行二次检索。
其他文献
在信息化时代,信息瞬息万变,信息量急剧增加,在信息系统中,单靠人工管理编码对象、编码规则和码表的修订发布都是非常烦琐和困难的。对信息进行分类编码,需要以信息分类编码
随着银行不断加强用户自助存取款业务,自助取款机得到越来越广泛地使用。与此同时产生的自助取款机犯罪案件数量也明显上升,而此类案件的犯罪人员往往戴有墨镜、口罩或者帽子
近年来,微博得到了飞速地发展。用户可以在微博中进行交友、聊天、发布状态,同时还可以发起话题,评论话题等。分析和挖掘微博的热门话题具有重要的意义。目前微博话题挖掘通
指挥控制系统是当前我军信息化建设的重点,而针对指挥控制系统的评估技术的研究又是系统开发和研制中的关键技术和难题之一,通过对系统进行科学合理的评估,可以确认系统性能的高
传感器网络是由大量传感器节点组成的分布式无线网络。为了实现传感器网络的安全通信,确保传感器网络中相互通信的节点间建立共享密钥是至关重要的。然而,由于传感器网络节点
随着Web2.0和企业互联网化的快速发展,O2O模式的广泛应用,电子商务的物品数目和种类日益增多。客户在网上商城购买自己满意的商品时,却需要浏览很多物品从而浪费大量的时间。
蛋白质的天然构象是由其氨基酸序列确定的,而蛋白质的生物学功能在很大程度上又依赖于其构象,因此蛋白质构象预测是蛋白质研究中发展已久但仍具有挑战性的问题,是后基因组时代生
家庭网络的增长是一个全球现象,到2007年估计将会增加到7130万。这种增长就给各种网络设备制造商提供了巨大的商机。在这样的背景下,Microsoft提出了UPnP的概念。 UPnP使网
移动互联网与物联网这两大网络的快速发展使得未来的网络面临着更高速度、更低延迟以及更高可靠度的挑战。各种各样的新兴应用使得这种挑战更加现实与紧迫。鉴于此,移动边缘
随着社会需求的不断发展,在军事、航天等高精领域中对嵌入式系统的性能和稳定性等要求也不断提高。为了开发更高性能的嵌入式系统,并行计算成为提高嵌入式系统的计算速度和可