论文部分内容阅读
目前搜索引擎已经成为人们在网上获取信息的一个重要途经,因此在搜索引擎中自然排名的高低也在一定程度上决定着网站的访问量。搜索引擎优化(Search Engine Optimization,简称SEO)技术的出现就是为了能够帮助网站管理员有效地提升网站排名。虽然现在搜索引擎优化技术的发展已经相当成熟,但其实施主要还是依靠技术人员对搜索引擎技术的理解以及自身经验,尤其是在网站链接结构优化和关键词的查找上。这种优化方法很少考虑用户的访问习惯,因此优化效果往往并不明显甚至还可能降低用户体验。然而对用户访问习惯的挖掘和分析正是Web数据挖掘的重要应用之一。本论文的研究目的就是将Web数据挖掘技术应用到搜索引擎优化中,以关键词优化和网站链接结构优化为主要研究对象,使得优化过程能同时关注搜索引擎和网站访问用户。论文完成的主要工作有以下几点:(1)首先对国内外学者的一些经典和最新的研究进展进行整理和归纳,对本文中所使用的Web数据挖掘和搜索引擎优化两项技术进行简要概述,并对其常用技术、研究现状和主要应用方向进行分析,确定本论文的主要研究方向。(2)按照数据采集、数据预处理、模式挖掘与分析的研究路线进行用户兴趣度挖掘算法的设计与实现。挖掘过程中采用客户端采集的方式进行数据采集,保证数据完整性的同时有效减轻数据清理的工作难度;使用sessionid进行用户识别,通过来源页的信息进行会话识别;对日志中的关键词信息进行补全,并建立用户浏览兴趣矩阵和剪枝矩阵,为后面的优化方案制定提供数据支持。(3)使用用户浏览兴趣矩阵和剪枝矩阵找出与待优化页面相关的潜在兴趣路径,根据潜在兴趣路径为网站制定内部链接结构优化方案,对比优化前和优化后的页面访问情况来验证优化效果。(4)使用补全关键词信息的数据建立关键词访问权重表,根据此表找出每个页面中以用户搜索为导向的关键词排行,按照此排名为网站制定关键词优化方案,对比优化前和优化后网站访问量与来源关键词数量来验证优化效果。本文通过上述几个方面的研究,从用户使用的角度出发,找到各个信息之间的共同兴趣点和关注点,应用到内部链接结构优化和关键词查找的过程中,为搜索引擎优化技术提供一种以用户为导向的优化方法。