元搜索引擎中结果聚合排序方法的研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:lanqishi1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何在互联网的海量信息中找到自己所需要的信息已经成为困扰人们的主要问题。元搜索引擎可以综合多个搜索引擎的查询结果,因而提高了搜索的覆盖率,但同时也带来了一些问题。元搜索引擎所得结果往往数目庞大,其中很多结果都与用户的查询没有太大关联。这直接影响了用户检索的质量,大大增加了用户检索的代价。为了帮助用户不受无用的信息干扰只获取所需的信息,本文对元搜索引擎所涉及的用户及网页技术进行了研究,提出了一种基于用户兴趣与网页分类的用户网页模型,并在此基础上对元搜索引擎的结果排序算法进行了改进。具体内容及研究成果如下:分析了用户与网页之间通过搜索引擎完成交互式的关系,提出用户兴趣与网页分类相匹配的多对多模型,并完成了兴趣与分类的转换规则的制定,建立了用户网页交互模型UPI。研究了用户兴趣分类的常用算法,提出显式反馈与隐式反馈相结合的用户兴趣信息获取方法,并完成基于UPI模型的用户兴趣自动更新的算法。深入的研究了网页自动分类技术,选取合适的训练集以及分类算法,完成了网页自动分类器的基本设定。在UPI模型基础上提出了网页类别更新的相关算法。研究分析了基于位置和基于相关度的结果排序算法,在这两种算法的基础上提出了基于UPI模型的排序算法。该算法通过分别计算网页位置分值,用户兴趣值和用户网页匹配值得出最终的网页分值,其中用户网页匹配值是基于UPI模型得出的。基于上述算法构建了相应的实验系统,通过实验验证了上述算法的搜索结果的有效性,并对其进行了相应的分析。
其他文献
随着工业的飞速发展、信息技术的不断进步,计算机信息系统在各个行业得到广泛应用。保证软件可靠性,提高软件的质量是软件研究的重要组成部分。目前,根据工业需求复杂度和规模的
用计算机对人脸图像进行处理进而实现人脸识别是如今的一个研究热点和难题,虽然已经取得了丰富的成果,但是也遇到了一些困难。例如:有效人脸特征的提取,识别率的提高等。因此,人脸
随着Internet技术的发展,B/S架构系统应用越来越广,如何实施对B/S架构应用的访问控制从而保障B/S架构应用的安全性显得越来越重要。然而,目前对B/S架构应用系统的安全防护还仅仅
由于各行各业对IT系统的严重依赖,高级持续性威胁(Advanced Persistent Threat,简称APT攻击)对政府部门、研究机构、军事组织和行业企业均构成了巨大威胁,已成为目前信息安全领
关于图像检索技术的研究兴起于20世纪70年代,当时主要是基于文本的图像检索技术,90年代以后,出现了基于图像的内容语义,如颜色、纹理、布局等进行分析和检索的技术,即基于内容的图
基于人体步态的身份识别是一种新兴的生物特征识别技术,它旨在通过人们走路的姿态进行身份识别。与其它的生物识别技术相比,基于步态的身份识别具有非接触、远距离和不容易伪装
IPv4地址已经耗尽,IPv6网络由试验转向商用阶段。原本IPv4网络中的许多协议不能直接应用到IPv6网络中。IETF分别制定了IPv6协议和DSR协议的相关标准,但是IPv4中的网络协议应用
学位
传统的信息安全系统主要防止外部的入侵攻击,与现在信息安全主要来自内部的威胁的实际不相符。随着信息安全系统的发展,产生了可信计算。可信计算是为了从根源上防止各种安全隐
信息化是当今世界发展的大趋势,是推动经济社会变革的重要力量,以信息科学为指导,以信息技术为工具,实现了农业信息化的快速发展。全面推进农业信息服务,是繁荣农村经济、加快现代