搜索引擎结果排序算法

被引量 : 0次 | 上传用户:wendi8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的飞速发展,导致网络数据不断膨胀,网络中积聚了海量的有用信息,如何从这些信息中获取用户兴趣信息成为时代的挑战。搜索引擎(search engine)技术诞生为用户发现兴趣信息提供了一条快捷的途径,在万维网中取得了广泛而成功的应用,并且逐步成为广大用户从网络中获取信息的首要方法。搜索引擎可分为元搜索引擎(如InfoSpace)、目录式搜索引擎(如雅虎、MSN)和全文搜索引擎(如Google、百度)等三类,其中全文搜索以其强大的功能和便捷灵活的特点迅速吸引公司、学者和用户极大关注,但是目前搜索引擎因为查全率和查准率的低下,其性能还有待进一步的提升。全文搜索引擎技术包括检索资源的组织标识、关键词匹配和结果排序等技术。由于网络信息量巨大,与用户查询项相关的网页也不计其数,若让用户通过阅读所有相关网页来筛选出最感兴趣部分,从精力上和时间上来说都是不切实际的。因此,面对海量的相关页面,如何快速地查询到目标内容已经成为信息检索领域的重要挑战。网页排序作为搜索引擎技术的重要步骤,对高质量的目标信息的返回起着关键的作用。在过去的几年中,搜索引擎排序有了很大的提高,目前的搜索引擎排名算法大多以网页的链接结构为基础,如非常受欢迎的HITS算法和PageRank算法。许多国内外研究者对这两种算法进行了研究和改进,并提出了一些更优的综合排序模型,但是还有许多需要进一步推进的工作。本文研究了国内外搜索引擎排序算法的发展历史和背景,深入分析了目前流行的各种排序算法的优缺点及排序效果,并对一些新提出的改进算法进行了探讨和总结。针对这些算法的不足,本文重点讨论了一种改进的搜索引擎排序算法,旨在提高用户搜索相关资料的效率和对数据的管理质量。该算法首先根据关键词的语义确定主题信息,然后利用用户的活动记录分析其行为和偏好,同时计算各相关网页的访问记录。若被访问越频繁,则代表该网页的重要程度越高,说明它更具有包含用户寻找的信息的可能。最后结合这三个方面的信息,返回更符合用户目标的内容。通过识别每个查询类型的特点,为Web搜索查询分离出信息型的、导航型的以及事务型的特征,将这些特征应用于现实的分类之中,自动分类排序Web搜索引擎检索结果。
其他文献
随着计算机应用对带宽需求的日益增长,PCI Express总线协议作为PCI-SIG规范并标准化的第三代高性能的IO总线技术,拥有点到点的串行数据高速传输等诸多优势,成为未来总线技术
本文介绍通过对树脂胶粘剂配方的改进,研制出一种新型的芳纶无纬布,采用合理的防弹复合材料压制工艺,制备防弹复合材料。其中交联剂的添加明显提高了无纬布压制的防弹复合板
<正>近日修订旧稿《文以载道——孟子文化精神研究》,想用传说中的"海瑞杀女"为《孟子》书里的"男女授受不亲"(《离娄上》7·17)做个注脚,于是上网检索。百度百科有"海瑞杀女
论五大连池现代火山文化的民族源刘振义五大连地火山群位于黑龙江省北部小兴安岭西南缘与松嫩平原接壤地带,是我国著名的火山群。小仓勉1936年指出,“五大连池火山是距今216年前喷发以
<正>同一座城市,有好几种面貌:有用刀剑刻出来的,那是政治的城市;有用石头垒起来的,那是建筑的城市;有用金钱堆起来的,那是经济的城市;还有用文字描出来的,那是文学的城市。
石墨烯是一种由碳原子以sp2杂化轨道组成的六角型晶格单原子层二维晶体。石墨烯有许多独特的性质,它是零带隙的半金属半导体材料,具有超高的费米速度(光速的1/300)、载流子迁
本文介绍了苹果酒的定义、营养价值及目前国内的发展状况,分析了我国苹果酒行业发展急需解决的问题,为促进我国苹果加工业的跨越式发展提供借鉴。
认知重评是一种情绪调节策略,它通过改变个体对情绪事件和场景的认知角度来调整情绪事件对个体的意义及价值评判进而调节情绪,有评价重视和评价忽视两种方式。认知重评与认知
中国英语产生于国际英语对中华文明和华夏社会的描述,也源于中国人用英语来描述自己与世界,它是国际英语的拓展与延伸。中国英语以标准英语为基础,但在语音、词汇、语法、语
超声成像技术是重要的医学成像方法之一,由于其具有低成本和对人体无损等优点,在临床诊断上具有无可替代的地位。随着近年来小型化、便携式超声诊断设备的发展,扩展了超声成