点击流数据仓库与数据挖掘研究

被引量 : 7次 | 上传用户:alanyu97
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务网站每天都产生大量的点击流数据。它们中包含很多对企业非常有用的信息。但是,面对众多的网站,展现在我们面前的都是前端系统,而对于网站结构、用户访问时间、停留时间、页面关系等缺乏足够的重视。日志分析工具也可以很好的对网站运行的基本数据进行统计,然而日志分析工具没有涉及一个网站统计的重要内容,即访问网站的用户行为分析。而建立点击流数据仓库的目的正是通过用户行为分析来推动网站的商务发展。点击流数据仓库(Web日志数据仓库)是数据仓库的一个重要类型。与传统的数据仓库相比点击流数据仓库的主要数据来源是人们在进行各种网络活动时,在各个网络服务器中所留下的Web日志文件以及其它的相关数据库数据。建立结构合理的点击流数据仓库,并结合数据挖掘等技术对其海量数据进行有效的分析,不仅可以解决海量数据的存储问题,而且可以很好得保证电子商务系统的可用性和高效性,保证数据的安全性。在本文中点击流数据仓库的建立主要是面向用户信息兴趣的分析。在实施应用的过程中,本文针对电子商务环境对响应时间的敏感性,引入了操作型数据存储(ODS)的概念。同时,针对传统的数据仓库系统的DB-DW两层体系结构存在的缺点,重点提出并分析一种基于ODS的三层结构点击流数据仓库构建方案。在数据预处理过程中,重点研究Cookies技术在处理本地缓存和代理服务器等方面的应用。利用基于SQL Server 2005平台构建的点击流数据仓库和相应的数据分析、数据挖掘等辅助技术,结合以Java实现的数据挖掘系统对大连海事大学一个高校电子商务平台—海易网的Web日志数据进行有效的分析,获取用户潜在的访问信息,从而为Web用户提供更加优质的服务。以数据仓库为基础,深入分析用户行为特征,将成熟的数据挖掘算法迁移到Web日志领域是将来发展的趋势。
其他文献
目的研究股骨近端抗旋髓内钉内固定术在治疗股骨转子下骨折时的临床效果。方法选取2017年8月~2018年12月在本院接受股骨转子下骨折治疗的95例患者,对照组使用股骨近端锁定钢
<正>据经济参考报道,我国纺织品出口有很大潜力,主要潜力在质量上,但纺织品出口产品结构急需改变.原料、电力同样消耗了,增加创汇不多,为此,必须充分挖掘质量潜力,努力把出口
目的 巨大动静脉畸形难以治疗并且存在很高的治疗风险,我们通过随访,了解术中栓塞与手术切除联合治疗巨大动静脉畸形的远期预后情况,分析影响预后的临床因素。方法 1992年9
根据船舶驾驶时预知他船位置和会遇位置的需求,以及VTS对重要船舶行为预测的需求,提出非等时距时序残差ARIMA模型的船舶行为预测方法。根据时间序列分析的原理,构造船舶行为
目的分析防旋股骨近端髓内钉(proximal femoral nail antirotation,PFNA)治疗股骨粗隆间骨折术后失效的原因,从而减少相关并发症的发生。方法对本院2013年3月至2017年9月采取
目的 自发性蛛网膜下腔出血(SAH)多数是由于颅内动脉瘤破裂而引起。准确诊断、评价颅内动脉瘤对临床治疗有重要的意义。通常2D DSA只能提供颅内血管的二维影像。虽然3D-CT
在传统的语文教学中,习作教学历来是与阅读教学平分秋色的教学任务。根据课程标准的理念和习作要求,需要对传统的作文教学进行改革。如何改革?研读2011年版《语文课程标准》,
在新时代背景下,乡村文化有了新的时代内涵,其类型多样,包括生计文化、精神文化、行为文化、融合文化。乡村学校作为乡村社会中的文化高地,应肩负乡村文化传承的重任。乡村教
现代国家中,立法机关对于科技政策法案往往无法作详细的规定,而委诸行政机关以行政立法或行政规则作进一步的规范,而且这类规范会随着科技的发展或研究的最新发现,作相应的调
研究背景和目的:在急性心肌梗死(acute myocardial infarction, AMI)后发生的左心室进行性扩张和外形改变被称为“梗死后心室重构”,包括心室容积、形状、室壁厚度、心肌结构