搜索引擎排序算法研究

被引量 : 0次 | 上传用户:ylh644894056
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的出现和迅速发展使信息检索的环境发生了重大变化,网页数量的暴涨,使人们快速准确的获取信息的难度增大。在这种背景下,搜索引擎成了人们不可或缺的信息检索工具。但搜索引擎返回的网页数量往往很大,如何让用户在大量的返回结果中迅速找到最准确的信息,则显得尤为重要。而搜索引擎的网页相关性排序算法,就能够决定用户是否能在排序靠前的网页中找到想要的信息,因此排序算法直接影响搜索引擎的使用体验,决定了搜索引擎的实用性。现有的搜索引擎排序算法,以基于网页链接结构的算法为主,主要的两种代表性算法是PageRank算法和HITS算法,基于这两种算法国内外许多学者和研究机构进行了不断的探索和改进。本文研究在分析国内外搜索引擎发展的基础之上,对经典排序算法进行了深入分析(如PageRank和HITS),将国内外现有的改进算法进行了归纳和总结,并针对ARC算法(改进的HITS算法)的特点和不足,提出基于链接相似度的改进算法,并利用贝叶斯概率模型推导出简化方法。然后建立搜索引擎实验平台,对基于链接相似度的ARC算法进行了验证,实验结果表明改进的ARC算法有效控制了主题漂移,提高了搜索引擎性能。
其他文献
目的发现一系列新型选择性Mer酪氨酸激酶抑制剂(TKI)的母核结构,并依据其设计化合物。方法分别利用3个已发表的Mer TK及配体(化合物1、2和3)的复合晶体结构(PDB code:3TCP,4MHA和4M
2019年2月3日(腊月二十九)至10日(正月初六),中央广播电视总台中央电视台新闻频道全天候播出系列快闪视频——“我和我的祖国”,包括北京首都国际机场、广东深圳北站、海南三
近年来,我国实施“走出去”战略取得了显著的成效,“一带一路”倡议又为我国对外投资带来新的机遇和新的格局。然而,我国在“一带一路”沿线国家投资面临诸多风险和不确定性,
1998年从病死猪分离了数株链球菌(其中2株编号为9801,9802),经鉴定,9801株为猪链球菌2型,9802株为马链球菌兽疫亚种。9801株系从暴发流行地区的病猪中分离,同时在该流行地区还发生畜禽从业人员感染相同血清型的
【正】王凡《读【古汉语虚词】》(载《中国语文》1983年第4期)在评述杨伯峻先生《古汉语虚词》关于“彼其”的解释时,提出了如下看法:“‘彼其、此其、是其、夫其’这类现象,
文昌凹陷作为珠江口盆地珠三坳陷重要组成部分,其形成和演化经历了复杂的地球动力学过程,外受太平洋板块、印度板块和菲律宾板块影响,内受珠三南断裂带及其它断裂活动的影响
进入21世纪后,随着经济全球化进程的不断深入,企业社会责任在世界范围内越来越引起广泛关注,并逐渐形成了持续发展的国际潮流。在西方,各大跨国公司将其视为公司核心业务运作
电子吊舱安全、高效的工作有赖于优良的吊舱环控系统,动力涡轮驱动的逆升压空气循环制冷系统就是这样一种能够适用于电子吊舱的环控系统,它具有结构简单,重量轻,代偿损失小,
目的以中国/联合国人口基金第六周期生殖健康/计划生育项目为依托,通过对六个项目县2006年-2008年培训情况以及2009年培训需求分析,尝试从优化人力资源的视角探讨中国基层人
近年来,设施农业发展迅速,特别是在自动监控方面是其中的一个研究热点,而该领域的特点就是监控区域很大,因此需要大量的传感器节点构成大型监控网络,通过各种传感器采集诸如