基于商空间粒度计算的点击流数据仓库的构建及挖掘算法研究

来源 :兰州理工大学 | 被引量 : 2次 | 上传用户:lihao527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的迅猛发展,点击流数据仓库的研究越来越引起重视。点击流数据包含许多对企业非常有用的信息,包括客户的来源、消费行为、访问兴趣、访问意图等。通过研究这些信息,能够对电子网站的建设起指导作用,同时也可以了解客户的购买行为,进而优化网站拓扑结构,提高点击流数据仓库的性能,预测产品销售,提升服务质量。本文构建点击流数据仓库的数据源来自某购物网站。从数据仓库的整体框架、设计模型、ETL构建等方面对购物网站中点击流数据仓库的构建过程进行了整体概述,通过实验验证整个构建过程,最后得到一个可用的点击流数据仓库的解决方案。点击流数据仓库的处理问题更多是数据源的问题,针对点击流数据源的多样性,采用基于时间特征的数据抽取策略进行数据预处理;针对点击流数据源的复杂性,采用基于商空间粒度计算的数据挖掘算法。处理过程中重点关注用户在网站上停留时间较长的站点,关注用户频繁访问的站点。通过基于商空间粒度计算的关联规则挖掘技术发现购物网站中不同站点之间的关联程度,多层次、多角度分析挖掘数据源,简化了数据收集的流程,然后结合Web关联规则的数据挖掘技术,改进了的用户频繁偏爱路径挖掘算法。利用寻找到的用户兴趣度,有目的的优化购物网站的网络拓扑结构,改进服务质量,进而增加网站产品销售量。该点击流数据仓库构建方案不仅支持点击流网站信息的日常数据分析,同时支持数据仓库Web日志基础上的用户使用模式的深层次挖掘,进一步分析销售情况。
其他文献
期刊
噪声降低了图像质量,增加了图像的复杂性;边缘是图像的主要特征,图像边缘检测是图像处理领域最重要的技术方法之一,因此图像去噪与边缘检测一直都是图像处理领域的重要研究内容。
期刊
网络环境越发复杂,应用种类越发丰富,管理人员对网络流量监控系统的要求也日益增加。近年来,网络设备供应商推出了多种网络流量测量技术,其中以基于Flow的技术,由于其流量信
期刊
期刊
期刊
新稚人民广播电台〔1。件〕等级类劝J语种绷汉哈食维汉汉维汉维汉维汉策维哈特等奖团结战斗的凯歌 关一厂冻雨的报道一等奖二娜奖三等奖阿勒泰大尾羊同多兰公羊配有出新品种
我是一个久居农场,年近半百的老通讯员,与记者一起集体采访还是头一次。虽然只有短短几天时间,但我已从他们的工作态度、采访作风等方面学到了许多东西。那是在北疆铁路铺轨
随着计算机技术的发展,数据库逐渐成为主流的数据存储方式,对数据库的检索也变得日趋重要。然而对数据库传统的检索必须了解数据库的运行原理、使用复杂的命令集和形式化计算机