基于PageRank算法的搜索引擎优化策略研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:green7116aaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的迅猛发展,WWW 已成为信息发布、交互及获取的主要工具,它涉及新闻、广告、消费、金融、教育、电子商务等许多领域。Web 具有四个特点:庞大性、动态性、异构性、半结构化的数据结构环境。此外,Web还包含丰富和动态的超链接资源。面对Web 这些固有特点,人们要从这些海量的数据中查找数据和信息,使用最多的就是搜索引擎技术。Web 挖掘包含三个方面的内容:内容挖掘、结构挖掘和使用挖掘,本文主要涉及到其中的Web 结构挖掘。结构挖掘是从WWW 的组织结构、Web 文档结构和链接关系中推导知识。就搜索引擎技术领域来说,可以通过分析一个网页或整个网站链接和被链接的数量、对象,建立Web 自身的链接结构模式,通过分析和研究PageRank、HITS,TSPR 等基于链接结构的搜索结果排名算法,可以指导网站链接结构优化,有组织,有规划地提高网页在搜索结果中的排名,避免盲目处理造成的混乱结果。本文主要针对目前主流的PageRank 算法,集中研究了该算法的形成思路、计算方法,并分析该算法在独立网站、包含索引页面、包含入站链接和出站链接等几种模型下的效果,提出了相应的优化策略。然后概要介绍了java 版PageRank 计算程式的大体思路,并给出了通过本程序验证这些优化策略的实验结果。最后通过总结PageRank 算法的优缺点,引入了Topic Sensitive PageRank,Hilltop 等算法并做了简要介绍。Web 挖掘是知识时代人们对于从大量信息中获取知识的需要。对于搜索引
其他文献
金融行业的高利润和高风险,是一直讨论的话题,而监管政策就像是过桥时的栏杆,保护每一个用户安稳前行。2013年到2015年,金融行业“乱象丛生”。中国市场上P2P网贷平台数量从8
研究了采用强耦合整体方程计算柔性膜结构风致流固耦合效应的求解问题。针对柔性膜结构经历大变形的特性,在经典投影法的校正步中引入修正因子使在原始动量方法中隐性定义的
目的 探讨N末端B型脑钠肽前体(NT-proBNP)、超敏C反应蛋白(hs-CRP)、胱抑素C(CysC)对急性心肌梗死(AMI)的诊断价值。方法 选取收治的AMI患者60例作为观察组,选取60例健康体检
目的探究常规技术和三维适行放疗(3DCRT)在食管癌根治性放射治疗中的剂量学对比。方法选取接收的行食管癌根治性放射治疗患者512例为研究对象,根据随机数字法随机分为甲、乙
东城安德城市森林、广阳谷三期等13处城市森林,营造出“结庐在人境,而无车马喧”的野趣魅力;西城景山公园西门、朝阳夕拾园、丰台中顶庙等60处口袋公园及小微绿地,让市民推窗
受之前国内信贷紧缩、对外贸易局势紧张等因素影响,叠加当前新型冠状病毒肺炎疫情给经济造成的损失,中国经济发展面临着大量现实问题和风险战.在此背景下,贯彻中央经济工作会
我国每年有数万件未成年人犯罪案件要经过刑事司法程序作出处理,未成年人刑事司法已成为我国刑事司法的重要内容。然而,在未成年人刑事司法中,定罪标准掌握不一,同罪不同罚,
有一种精神叫奉献:他们牺牲小家、保卫大家,只因心中芳华如花;有一种责任叫志愿:他们春风化雨、润物无声,只因心中使命如山;有一种感动叫坚守:他们冲锋在前、坚守一线,只因心
在以习近平同志为核心的党中央坚强领导下和全国人民的共同努力下,新冠肺炎疫情得到了有效的控制,防控已经到了决胜阶段,但形势依然严峻。疫情当前,各地档案馆采取了暂停现场
2020年年初,新冠病毒肺炎疫情被世界卫生组织列为“国际关注的突发公共卫生事件”,我国各级各类档案部门积极参与疫情防控工作。如浙江省档案馆合理统筹疫情期间档案工作,采