融入了相关性的Pagerank算法的研究与实现

来源 :海南大学 | 被引量 : 0次 | 上传用户:mengwb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的出现和迅速发展使信息检索的环境发生了重大变化。目前人们在互联网上搜索信息主要是通过Google,百度等通用搜索引擎。这类搜索引擎的功能已经十分强大,在一般情况下是可以满足用户需求的。然而当用户只想查询具体某专业、某行业或某种主题的相关信息时,这类搜索引擎就会显得有些力不从心了。这主要是因为链接拓扑学在鉴别网页重要性中被广泛利用。这种基于链接分析的排序算法并没有考虑到网页内容的相关度。   如今最被广泛应用的Pagerank算法就是这种基于链接分析的。我们将在传递页面的Pagerank值时考虑被链接页面内容的相关度论文首先介绍了搜索引擎的发展和现状,然后介绍了经典的检索模型原理及特点,接着详细的讲解了现如今大部分搜索引擎所运用的排序算法--Pagerank算法,现在大部分搜索引擎所运用的排序算法都是基于链接分析的。通过其原理介绍和运算原则指出了其在实际运用中的缺点。一些网站运用合理的链接改善,使得自身网站在排序时得到好的名次。针对这个问题,提出了融入了相关性的Pagerank排序算法的改进。   结合网页链接分析和网页内容相关性分析提出一种改进的:Pagerank算法EPR(Extended Pagerank),从分析网页内容相似性的角度解决相关性需求,从网页链接分析的角度解决权威性需求。算法为扩展Pagerank提供了广阔的空间,并且实验证明,通过选择合适的参数EPR算法可以获得优于传统Page rank算法的排序结果。
其他文献
Windows CE是微软公司推出的一项功能强大的实时嵌入式操作系统,它具有很多优秀的性能。Windows CE操作系统的模块化设计,使得开发人员可以根据需求定制设备,这种定制有助于
语音转换是指改变一个人(源说话人)的语音个性特征使之具备另一个人(目标说话人)的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种语音处理技术。随着现代
极化合成孔径雷达(Polarimetric SAR)影像包含丰富的目标信息,近年来成为遥感识别领域的研究热点。其中,地物分类方法的研究是极化SAR影像解译的重要组成部分,在军事、民用等
传统米波雷达规模庞大、机动性不足、造价成本较高。为了提高米波雷达的测角精度同时保持一定的机动性,本课题组提出了分布式米波雷达的实现方案,利用多个分布式的小型米波阵
H.264/AVC(Advanced Video Coding)是ITU-T和MPEG合作制定的视频编码标准,该标准同时作为MPEG-4的第10部分,是目前最新的视频编码标准,与以往标准相比,H.264在帧内编码,帧间
一体化摄像机体积小巧、美观,功能扩展方便,有广泛的应用前景和使用价值。目前,在安防监控领域,PAL一体化摄像机仍是主流产品。然而,无论技术还是市场国外厂商都占据主流。经调查
随着合成孔径雷达(Synthetic Aperture Radar,简称SAR)技术的不断发展,基于合成孔径雷达的自动目标识别(Automatic Target Recognition,简称ATR)技术已成为国内外研究的热门
Ad Hoc网络由一系列能自我配置的无线节点组成,该网络不需要借助任何基础设施。当前,随着无线网络的快速发展,人们势必希望在Ad Hoc网络中能够支持无线视频业务,然而在Ad Hoc网络
在各个领域中,流程图都是一种重要和常用的信息表达方式。目前的流程图制作软件操作繁琐,因此能够将手绘流程图转化成标准流程图就显得非常有意义。随着手机等带摄像头手持设
竞技类运动拥有悠久的历史,特别是随着近代科技的快速发展,更多的竞技类运动被现代科技不断推向高层次的赛事,从而使竞技类体育项目更为迅速得到了普及,因此摔跤这项古老的体育运