论文部分内容阅读
近年来,网络技术迅速发展,随着科技的突飞猛进,以及生活水平的日益提高,越来越多的人喜欢到网上了解和搜索自己感兴趣的东西,网络已经成为了人们沟通交流的重要途径之一。同时,网站作为一种新的信息平台,受到了越来越多的公司、企业甚至个人的重视。企业网站按照功能大致可以分为企业形象展示、公司产品推广、信息发布和数字商务类型。无论哪一类型的网站,最终目的还是要吸引客户访问,从而提升公司形象,促成产品交易。企业网站的结构设计、页面信息等因素将会直接影响浏览者对企业网站整体乃至整个企业的印象。所以,公司网站在运行的同时,还要根据用户的访问习惯和访问要求及时进行优化。发现用户潜在的访问规则,在网站优化工作中显得尤为重要。所以,Web日志挖掘技术应运而生。Web日志挖掘是Web挖掘中很重要的一个研究领域和研究方向,通过分析和发现Web日志记录中的规律,从而挖掘出Web用户潜在的使用规律和模式,给网站管理者提供网站结构优化的建议和指导,将发现的结果在网站结构调整及页面内容优化中进行应用,改善网站的设计,提高访问者的浏览兴趣。Web日志挖掘的应用虽然已经相当广泛,但是,针对不同企业Web数据的实际情况,要使用不同的研究分析方法。北京盛安德科技发展有限公司是一家针对国外客户从事外包服务的软件企业,公司网站是一个很重要的进行宣传、交流、沟通的平台。本文正是基于北京盛安德科技发展有限公司重庆分公司的网站优化中所用到的Web挖掘知识展开分析研究。本文介绍了Web数据挖掘的基本概念、分类,并给出Web日志挖掘的基本原理、方法,指出Web日志挖掘的用途,展望了其美好的发展前景。同时介绍了网站优化的相关理论和方法。重点研究了Web日志挖掘的数据预处理技术和统计分析方法及关联规则算法,并提出了基于关联规则挖掘的路径分析新算法,然后将其应用于指导实际的Web日志挖掘工作,构建了简单的网站访问信息管理平台,利用发现的知识对网站的结构和内容进行优化,从而提高了网站的整体性能。最后,对本文的工作进行了归纳与总结,探讨了将来进一步的研究方向。