基于点击流Web用户行为挖掘

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:liangxinnet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在浩如烟海的互联网信息世界中,人们高效率地获取所需信息越来越难。究其因为,一是由于信息资源在分散性和用户信息需求的有限性和动态性之间在矛盾,二是现有搜索引擎和信息服务工具存在缺陷与信息服务准确、实时的需求之间不适应。比较好的解决方法就是寻求一种优秀的信息服务方式,使其更好地满足用户的需要。数据挖掘和数据仓库技术起源于对大量数据的存储和分析的需要。在激烈的市场竞争环境下,基于业务数据的决策分析系统将发挥巨大的作用。正是在这种需求的推动下,支持海量数据存储、OLAP(联机分析处理)和数据挖掘应用的数据仓库技术应运而生。其中,点击流数据仓库是数据仓库技术发展的一个方向。   随着电子商务的飞速发展,电子商务对企业的经营活动开始产生巨大的经济效益和社会效益。电子商务网站每天都产生大量的点击流数据。在这些点击流数据中,包含着对企业决策非常有用的信息。比如:Web客户的来源、行为以及兴趣爱好等。通过对这些数据进行有效分析,不仅能够对网站的建设起到指导作用,改善客户关系管理和提高客户体验度,还能够反映产品的市场、营销方面的状况,提高企业在市场营销和服务等各方面的质量。   本文探讨了点击流数据仓库的建立及其应用。首先研究了点击流数据仓库的维度建模方法、设计了一个面向Web用户行为挖掘主题的数据集市和点击流数据集市的ETL处理机制。在数据仓库的多维模型设计中,讨论了Web点击流数据仓库的各种数据来源、站点用户的识别级别划分、页面识别技术和会话识别技术,并且提出面向Web用户行为挖掘主题的会话事实表、页面点击事实表、客户-业务事实表以及各事实表的维度属性。在建立了点击流数据仓库之后,本文还提出一个改进的频繁项集挖掘算法--TMDHP算法。TMDHP算法利用散列技术以及事务标记的方法,快速筛选Web用户的点击流数据中的频繁点击模式,然后利用SAS EM软件中的Link Analysis模块进行Web用户的行为挖掘。最后再对数据挖掘结果进行图形化显示和分析。   最后对论文阐述的内容做了简要总结,针对点击流数据仓库应用研究的发展趋势和发展方向做出展望。提出本文的不足之处主要表现在Web客户行为挖掘结果方面缺少深入分析,以及未能实现结合其他数据源对Web客户进行流失分析并且将分析结果运用于企业的决策分析过程中。这些都将为下一步继续研究的重点内容。
其他文献
随着移动互联网的飞速发展,各种移动互联网应用已经成为人们最重要的信息交互平台,这些信息交互平台将人们串联成各种各样的虚拟社会网络。多个社会网络可以通过节点或关系的
随着软件产品与计算机一起广泛应用到各类民用和军用设备中,软件故障已成为造成计算机系统产生重大问题的主要因素,因此,开发可靠性的软件产品变得日益重要。在软件开发过程
基于视频的三维人脸动画驱动技术是人机交互领域的一个研究热点,其中包含了人脸检测、跟踪与特征定位和提取技术等人脸信息处理的关键技术,在学术领域、应用领域都有着极其重
随着无线通信、传感器技术,计算机技术和网络技术的快速发展,集成这些技术的无线传感器网络应用越来越普及。无论是医疗检查,地理气象监测,还是军事侦查,以及数字化生活中的
疲劳驾驶是当前交通事故发生的主要原因之一,因此驾驶员疲劳检测成为了当前研究的一个热点。基于机器视觉的疲劳检测,以实时性、非接触性方面的优点,成为疲劳检测的一个主要
三维人脸建模一直以来都是三维建模中的热门研究课题,其在虚拟实现中是一个极为重要的部分,无论是3D游戏还是电影的特效制作,对人物尤其是面部的要求一直都是最高的。人脸通
近年来P2P技术高速发展,P2P应用也由传统的文件共享型应用逐渐向多个领域扩充。由于互联网上多媒体信息处理技术的普及,流媒体技术与P2P架构相结合产生了P2P流媒体这种新型互
随着云计算产业逐渐成熟,软件即服务(Software as a Service,SaaS)作为云计算中的一种重要的服务交付方式得到广泛的应用。在SaaS模式下,成熟的服务提供商为了降低运营成本,
随着SDN网络规模的扩展,单一结构集中控制的控制器(如NOX)处理能力受限,扩展较难,遇到了性能提升的瓶颈。目前网络中可采用扩展单一集中式控制器的方式有两种:第一是通过提升
无线传感器网络具有功耗低、成本低、分布式和自组织等特点,往往被部署在各种恶劣环境中,改善了人们获取信息的能力。能量高效的可靠传输机制对于延长能量有限的传感器网络的