论文部分内容阅读
知识迅猛增长的现在,谁获得了更多的有价值的知识,谁就在这个竞争极其激烈的社会中掌握了主动权。随着Internet及其相关技术的不断发展与日趋成熟,WEB信息以指数速度增长。在这个信息飞速发展的时代,面对种类繁多的,更新速度惊人的信息时,人们往往会产生一种茫然不知所措的感觉,面对互联网上海量的信息,用户想从这些信息中搜索并获取自己想要的知识,并没有因为知识的数量多而变得更加容易,反而变得更加的困难。搜索引擎技术的出现,在一定程度上解决了人们的这一难题。鉴于现有搜索引擎存在的信息覆盖率低,用户满意率不高,及反馈结果质量低等问题,元搜索引擎的出现,弥补了这个弊端,特别是把用户兴趣这个因素考虑进来使得信息查询准确率和查全率有了大幅度的提高。这也成为当下比较热门的研究课题。本文第一阶段,对元搜索引擎的发展现状进行分析,针对现有的元搜索引擎存在的查全率、查准率不尽人意,以及不能考虑用户个性化需求等问题,提出一种基于用户兴趣的元搜索引擎设计方案。第二阶段,对创建用户兴趣模块以及怎样把用户兴趣应用于元搜索引擎的实际操作过程中这两个问题进行详细分析论证。总结得出一种基于网络日志的用户兴趣模块创建方法:把用户的网络日志进行分类归纳处理,得出用户的感兴趣的不同类别的术语;第三阶段,提出一种基于分类术语库的元搜索引擎调度策略。第四阶段,就是对被调用的成员搜索引擎返回的结果进行基于用户兴趣的相关度排序,提出一种基于用户兴趣模型的结果整合算法最大限度的排除了各独立搜索引擎中的竞价排序因素带来的不良影响。最后,在前面做的大量工作的基础上搭建了一个基于用户兴趣的元搜索引擎系统。本文重点对元搜索引擎系统中所采用的各成员引擎的调度算法的改进以及实现进行了详细的分析和讨论,并对成员引擎返回结果页的信息抽取技术和元搜索引擎反馈结果排序排名算法做了深入分析和说明。最后,通过在实际中进行使用,并对得出的实验结果的进行分析和比较,验证了基于用户兴趣的元搜索引擎在实际使用过程中更能满足用户查询检索的需求,有一定的实际意义。