论文部分内容阅读
随着Internet的迅猛发展和WEB的全球普及,各类网站所提供的功能和服务越来越丰富,然而在智能化方面表现得却不够理想。比如,网站结构缺乏灵活性;提供的服务或信息分布不合理,未能充分考虑到用户的需求;信息的访问路径未能考虑到信息的重要性和普遍关注性等等。如果网站能够根据用户的行为模式自动的学习,改良自身的组织结构和表现形式,这无疑将极大的方便用户的访问。
本文尝试利用WEB挖掘技术对的WEB访问日志数据进行深入地分析和研究,挖掘出用户的个性化访问模式,并在此基础上智能的调整站点页面结构和栏目信息排列,对用户进行智能地信息推荐,达到智能建站的目的。所做的工作主要包括以下几个方面:
(1)分析了数据挖掘技术的产生原因和发展背景,介绍了数据挖掘的分析方法、应用范围及最常用的挖掘技术。
(2)对WEB数据挖掘体系结构进行了深入的分析和研究,综述了WEB数据挖掘,给出了相关的定义和分类,并就WEB日志的挖掘技术进行详细地探讨,描述了WEB日志数据挖掘的一般过程。
(3)在对人们访问习惯进行系统分析的基础上,对站点的智能化提出了两种智能策略:以模板和模块为单位定制站点页面,并根据页面各个区域位置设定不同的权重,而后再根据曰志挖掘结果和权重自动调整页面;在站点首页提供专门的热门推荐专题栏目,用来展示挖掘结果汇总的整个站点最受欢迎的信息集合。实验证明,该系统具有一定的智能性。