搜索引擎分析——基于Page Rank算法的研究与改进

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:asdf1aasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随互联网爆炸性的发展,网上信息浩如烟海,普通网络用户想找到所需的资料难于大海捞针,所以迫切需要一种优异的搜索服务,将网上繁杂的内容整理成为可方便获取的信息。搜索引擎技术为解决这一难题做出了突出贡献,搜索引擎提供的结果集中页面质量的好坏以及高质量的页面能否在结果集中有较好的排名,对搜索引擎用户来说具有重要意义,同时也是衡量搜索引擎技术优劣的关键指标,所以对页面进行重要性评估并按重要性排序是搜索引擎要解决的技术核心。 本文首先介绍了搜索引擎的组成、原理、工作流程以及发展现状,分析了其存在的优缺点;然后对Web挖掘的三个方面:内容挖掘、结构挖掘和使用挖掘做了简要分析。 其次,本文在介绍PageRank与HITS两种基于链接结构的搜索引擎排序算法的基础上,就链接和被链接的数量、对象以及Web自身的链接结构模式对这两种算法进行了对比分析,并重点研究了PageRank算法的思想和计算方法。 最后,通过深入分析PageRank算法后,本文提出了改进的SP-PageRank算法,并对算法所用到的内外存交换原理做了比较深入的研究,利用Java语言实现了基于数据预取的PageRank与SP-PageRank计算平台。在搜狗实验室提供的3个链接数据集上进行了实验,实验结果表明,基于数据预取的PageRank与SP-PageRank算法比未使用数据预取的时候在计算效率上有较大提高。
其他文献
随着我国沿海经济持续增长,水上交通运输需求急剧增加。近年来,杭州湾航区高速船客运市场发展迅猛,业内外人士对于水上高速客运市场充满了期望。但是,由于自然资源的有限性,
近期金融海啸席卷全球,对于我国大学生就业环境的影响越来越严重,并且在办公自动化程度、统计分析、适应性等方面对高校毕学生就业工作特别是高校毕业生就业信息化工作提出了
随着计算机技术、图象处理技术的不断发展,视频监控已经成为计算机视觉领域的一个重要研究课题,而运动目标检测与跟踪是视频监控的重要组成部分。本文基于全方位视觉设备获取
耳语音转换为正常语音在通信系统、安全保密系统、金融系统、医学等领域有着广泛的应用前景。汉语耳语音的转换目前仍处于研究的初级阶段,由于汉语耳语音与正常语音的巨大差异
现在的社会是信息社会,计算机网络扮演者越来越重要的角色,但如今黑客猖獗,入侵手段越来越隐蔽,造成的损失越来越大,网络安全越来越受到了人们的重视,传统的网络安全技术已经不能满
电视网、电话网和传统计算机网络合并为一个数字化、分组化的集成网络已经成为不可阻挡的趋势,密集波分复用技术为“三网合一”提供了高速通信条件,而现有的Internet所提供的
自20世纪80年代开始,世界上所有发达国家相继建成了国家级的教育和科研计算机网络,并成为这些国家教育和科研工作最重要的基础设施,从而促进了其教育和科研事业的迅速发展。1994
学位
针对目前骨架提取算法普遍存在的准确性与复杂度的矛盾,本文提出一种基于特征点求解的Reeb图骨架提取算法,创新地将提取特征点和Reeb图结合用于骨架提取,在保证骨架提取准确
遥感技术是20世纪60年代兴起的一种探测技术,它根据电磁波理论,应用各种传感仪器对远距离目标辐射和反射的电磁波信息,进行收集、处理,并最后成像,从而对地面各种景物进行探