基于WEB的搜索引擎算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:guogangw1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web信息的急剧增加,用户如何准确、快速有效地从海量web信息中提取所需信息,已成为当前急待解决的问题。搜索引擎技术是解决用户检索海量web信息的有效途径之一。目前搜索引擎应用面广,使用率高,具有很大的经济价值,而且发展空间巨大。因此,对搜索引擎技术的研究己成为信息检索领域的研究热点。   搜索引擎是一种应用在Web上的在线软件服务系统,它以一定的策略在Web上搜集和发现信息,并对信息进行分析、提取、组织等处理形成数据库,为网络用户提供信息查询服务。   本文结合主流中文搜索引擎对搜索引擎的概念、分类和发展现状进行阐述,对搜索引擎的原理进行了剖析,对搜索引擎的关键技术进行了研究,提出了搜索引擎的评价标准;在对网络蜘蛛算法原理、策略和链接分析法进行研究的基础上,分析了贪婪蜘蛛算法的不足,针对性的提出了非贪婪网络蜘蛛算法,给出了非贪婪蜘蛛算法的链接价值计算方法和实现步骤,并用Java实现了该算法。同时,本文在对Yahoo、Google和Baidu三大主流中文搜索引擎检索特点、排序算法、检索结果和影响排序因素进行比较分析的基础上,对排序中的经典算法PageRank和Hits算法进行了研究,并提出了有益的改进意见。   本文是对基于WEB的搜索引擎原理、搜索算法和排序算法进行了研究,这对对从事信息检索的学者和专家、从事网站优化人员和广大搜索引擎用户具有一定的理论和应用参考价值。
其他文献
随着电子商务的迅速发展,网络上涌现了许多购物网站和产品论坛,这些购物网站和产品论坛不只介绍商家的产品,还为消费者提供了发表评论的平台,消费者能及时的将对商品的评论反馈给
随着信息技术的发展,作为传统实验教学的一种有效补充,虚拟实验教学已成为加强实践教学、提高教学质量的重要手段。虽然虚拟实验教学系统的研究与开发已经步入成熟,但是目前
近年来,物联网和移动通信技术的不断发展,使得人们对于基于位置服务的需求日益迫切。随着GPS卫星定位技术的广泛应用,其在室内环境中定位的缺陷显得越来越明显,基于近距离无
随着计算机技术的飞速发展,人们对计算机的需求和依赖与日俱增。计算机软件的应用领域正在进一步的扩大,伴随而来的就是软件的规模和复杂性的不断增加,这给软件测试提出了更
电子商务经过多年的发展,给商务企业带来了丰厚的利润和无限的商机,在整个商业活动中已具有举足轻重的作用。然而,电子商务所使用的技术普遍陈旧,大多停留在静态服务的层面上
资源配置是综合模块化航空电子系统(IMA)设计的重要环节,配置信息的安全性分析是保障整个航空电子系统安全性的关键。传统的安全性分析方法得到的结果往往不能展示其安全性属
随着计算机网络通信技术和多媒体技术的飞速发展,新型的人机交互技术已成为当前计算机科学领域一个十分活跃的研究课题。语音信号和面部表情一样,传递着情感信息。语音情感识
在程序设计和数据结构算法的教学中,算法的抽象性使学生难以理解其实质。算法演示可以辅助教师生动形象地教学,并帮助学生高效而轻松地掌握算法的设计原理和执行过程。本文在
远程实时监控软件是计算机取证中的一个重要组成部分,但在植入远程实时监控软件时往往会受到虚拟还原软件的干扰。因此,研究虚拟还原穿透技术对于计算机网络隐蔽取证具有重要
当今时代是一个信息时代,越来越多的企业实现了信息化管理,对一些大型企业或组织,有着大量的内部网语料,如何通过文本检索技术,自动挖掘出企业文本语料中的有用信息,受到了大