元搜索引擎中基于Agent的结果合成方法的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ruinx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
元搜索结果合成是将多个成员搜索引擎的检索结果进行结果融合的过程。结果合成技术作为元搜索引擎中的关键技术之一,直接影响用户对元搜索引擎的满意度评价。已有的结果合成技术采用单一的排序算法对结果重排序,然而单一算法在不同的网页结果重叠率下表现不一,导致在不同查询词下用户的查询效果差异显著,影响了元搜索引擎的性能。针对该问题,本文提出一种基于Agent的动态结果合成方法,选取多个排序算法作为成员排序算法,利用智能Agent感知当前查询词下的结果重叠率,根据重叠率动态调度其中最优的一种成员排序算法进行结果合成,从而缩小不同查询词间的查准率差异,提高用户满意度。本文的主要贡献包括设计动态结果合成策略以及设计基于Agent的结果合成子系统,具体的工作内容有:(1)通过分析单一算法的局限性,确定动态调度排序算法的策略。该策略选择多个算法作为成员排序算法,将结果重叠率作为算法调度条件。论文使用静态经验学习确定动态调度策略,即确定在当前结果重叠率下的最优算法。(2)设计结果合成过程中的去重,确定去重使用的方法及流程,同时确定结果重叠率计算公式。(3)由于当前的成员搜索引擎返回的结果不包含网页的初始相关分值,因此论文使用逻辑回归方程估计CombMNZ算法和SDM算法的初始相关分值。(4)根据论文的成员排序算法选择标准,确定动态调度的成员排序算法,同时分析这些算法的算法思想和计算公式。(5)利用用户点击日志数据分析用户对成员搜索引擎的偏好和用户的检索主题兴趣,使用成员搜索引擎权重和用户兴趣权值修正动态合成的结果,实现基于用户兴趣的结果合成。(6)在“智搜”元搜索引擎上实现基于Agent的结果合成子系统,分析系统结构图并对子系统中的各Agent模块进行分析。(7)设计实验验证论文所做的工作,实验分为三部分:在动态结果合成实验中,将本文提出的方法与Borda Fuse、CombMNZ等算法进行对比,验证了基于Agent的动态结果合成方法具有较高的查准率;在基于用户兴趣的结果合成实验中,对比登录用户与未登录用户进行相同检索时返回的结果序列,验证了添加用户兴趣因素后系统能够满足用户的兴趣需求;在基于Agent的结果合成性能实验中,对比使用Agent的结果合成与未使用Agent的结果合成所需时间,验证了使用多Agent系统实现结果合成在时间性能上具有的一定优越性。
其他文献
20世纪70年代以来,随着翻译研究的"文化转向",译者在翻译研究中的主体地位被重新确立,中外翻译界对译者主体性的探讨已表现出强烈的理论自觉性,并采取不同的方法对其进行研究,
<正> 一、国际社区发展协会概况与2003年会设在美国的国际社区发展协会创建于1969年,正值美国社会问题丛生,人权运动浪潮澎湃之时。近半个世纪过去了。今天这一组织的目标是
结合竖窑的生产设备及工艺特点,对影响石灰活性的因素进行分析,并提出包括原(燃)料质量、配比、布料工艺控制,以及窑炉煅烧、供风、卸灰工艺控制等措施。实践证明,通过优化原
毕业生刚步入社会时候,会遇到不签订劳动合同,要求支付不必要的费用,入职体检受到歧视,用人单位不缴纳社保费用等问题,这时候毕业生应该怎么做才能够维护自己的权益?在求职过
水利土方工程项目的规模相对来说会比较大,且各项施工流程也十分的复杂化,机械设备的数量以及种类都比较大,所使用到的施工技术也具有多样化的特征。对此,想要科学合理化的开
2016年9月利用多波束测深仪调查了张家洲河段河床微地貌的高分辨率形态与分布特征,结合1998年和2013年水下地形资料,分析了三峡截流以来该河段河槽的冲淤变化与演变趋势。结
纺织品的抗静电整理与人们的生活密切相关,但纺织品的抗静电性能评定对不同的市场有着不同的测试标准和要求。纺织品的抗静电测试主要以比电阻(电阻率)和电荷半衰期两种方法为
虽然新建物业维修资金的归集工作日趋完善,但也有疏漏的地方。本文就新建物业的维修资金的“归集”工作展开进一步探讨,分析归集的难点并找出解决的办法。
“功成拂衣去,归入武陵源。”在唐代著名诗人李白的心中,武陵源是一处理想梦幻的胜景。三千奇峰逶迤,穿越亿万年的时光隧道;八百秀水连绵,经历千百年的风雨雪霜。从古至今,武
随着我国经济的快速稳定发展,特别是城市化、城镇化步伐的不断向前推进,区域经济得到飞速的发展,特别是在沿江河、沿海等地区,凭借地理优势,发展势头迅猛,但是由于洪水的自然