论文部分内容阅读
电子商务网站积累了大量的业务数据和用户访问信息。将数据挖掘技术和Web挖掘技术应用到电子商务中,可以从海量的数据中得到有用的知识,用来指导电子商务网站对用户进行个性化服务,从而提高用户的获得率和忠诚度,增强网站的交叉销售能力。本文介绍了电子商务及其主要实现技术,指出了研究电子商务个性化服务的重要意义,综述了电子商务个性化服务的发展和现状,指出了Web挖掘技术对于电子商务个性化服务的作用和意义。本文论述了数据挖掘和Web挖掘技术的定义、特点、过程模型和研究现状。对个性化服务中主要使用的Web使用记录挖掘过程进行了描述。对Web日志挖掘技术进行了深入探讨,指出了其关键技术和难点。本文针对Web日志挖掘存在的困难和不足,根据电子商务个性化服务的要求,提出了在Web挖掘中使用用户访问记录代替Web日志作为主要数据来源,并且结合动态页面应用程序,主动、有选择性地进行用户访问记录的收集。本文指出了用户访问记录的组成,给出了具体的数据采集和用户识别方法,并进行了可行性分析和相关实验。实验表明,该方法对系统的响应时延影响很小,并且大大减少了待挖掘的数据量,减轻了数据清理的工作量,提高了用户识别的准确度,方便了用户识别工作,为提高数据挖掘算法实施的效率打下了良好的基础。据此,本文进一步提出了引入用户访问记录后的基于Web挖掘的电子商务个性化服务体系结构、工作过程和网站布置。在挖掘算法方面,本文对Web使用记录挖掘中普遍用到的访问路经分析和关联规则挖掘进行了简单介绍,重点对通过URL-UserID关联矩阵得到页面聚类和用户聚类的算法进行了研究。指出了可以结合用户的交易结果来评价用户对商品页面的兴趣度,并给出了改进后的算法和计算过程,从而使关联矩阵元素的权值能够更准确地反映用户对商品页面的感兴趣程度。