HFP-growth算法在wap日志挖掘上的应用研究

被引量 : 0次 | 上传用户:angie133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的普及,网络用户的日益增多,在服务器端和客户端都产生了大量的网络日志,这些海量数据如果不加以利用,就是死海。所以,应运而生地,有了数据挖掘这一学科。而Web日志挖掘正是数据挖掘针对Web产生的分枝。通过对网络日志的分析和处理,可以找出用户的行为模式,比如兴趣爱好,这样大量的数据就得到了应用,让沉寂的大海有了生命。Web日志挖掘的应用有利于电子商务系统的建立、发掘潜在的客户分析、提高网站的建设性能等方面。网络的发展延续到了手机时代,目前用手机上网的客户群不占少数,所以WEB日志挖掘有必要延伸到WAP日志的挖掘方向。目前在这一方面的研究成果还不是很多,但从用户群的数量可以看出,这一方面的学术研究会越来越被重视。WAP日志跟WEB日志稍有不同,预处理的时候可以不用考虑用户识别的问题,可以简单的把同一手机号码认为是同一用户,而挖掘的过程大相径庭,基本上都是实现对url的数据分析,WEB挖掘的方法同样适用于WAP日志数据。本文系统地介绍了数据挖掘产生和发展的状况,同时讨论了数据挖掘的流程及各流程的技术方法。尤其对Web日志的挖掘,进行了深入的探讨。首先,对预处理的各步骤及方法进行了详细的介绍,还配合了对WAP日志的处理,同时对真实数据进行处理,为后面挖掘工作做好准备。其次,对关联规则的两大算法进行了详细的介绍,APRIORI算法和FP-GROWTH算法,还针对FP-growth算法的不足,提出了新的HFP-growth算法,最后对这三个算法进行了比较,和举例说明,最后我们选择用]HFP-GROWTH算法来完成这次系统的挖掘工作。最后,我们对挖掘系统在VS2010上实现了挖掘,系统包括了数据预处理和数据挖掘两大模块,并应用到了真实的WAP日志数据上,得到了较为满意的答案。
其他文献
<正>考古是一架时间机器。当揭开历史那一层层神秘的面纱时,我们发现自己与历史原来是如此的接近,近得就像自己是每一段历史的亲身经历者一般,生活的方方面面都那样清晰地陈
通过对近3年针灸治疗颈椎病临床观察的一系列文献进行总结和分析,发现以椎动脉型为主的颈椎病有显著疗效。椎动脉型颈椎病是颈椎病的分型,临床主要表现有眩晕、头痛、猝倒、
<正>2013年岁末召开的中央城镇化工作会议明确提出,把"城市群"作为我国城镇化宏观布局的主体形态,促进大中小城市和小城镇合理分工、功能互补、协同发展。这一中国特色新型城
利用中国制造业、信息技术业上市公司2006—2010年的数据,探讨研发投资对企业融资的影响。实证检验结果显示,高新技术企业研发投资引起的融资约束程度远远大于非高新技术企业
伴随城市化的深入发展,如何构建可持续性的城市社区成为现代城市竞争中不可缺少的关键要素。因此,永续的社区发展与规划成为推动经济发展、生态环境、空间和谐等建设的重要手
三岛由纪夫作为近代日本文学史上具有重要地位,产生巨大影响的一位作家,有着极为独特而个性化的创作风格和美学原则。三岛是战后日本文学一个传奇而自我的存在,青少年时期特
本文在构建三元悖论指数(trilemma index)的基础上,通过协整分析、不重复Bootstrap的数值模拟、和误差修正模型,进行了两方面的检验:一是人民币区域化背景下三元悖论在中国是
<正>营造防冻小环境今年的4月6~7日,一场突如其来的晚霜冻害(倒春寒)席卷了长江中下游地区,导致江苏、浙江、安徽等多个省份的茶叶生产遭受严重损失。由于这次"倒春寒"发生在
针对汽车疲劳驾驶提醒装置价格高、安装复杂的问题,提出了一种疲劳报警的新方法———开发一种软件实现智能手机疲劳驾驶提醒功能;提出对PERCLOS、眨眼频率、眼睛闭合速度等
<正> 日本堀场制作所生产的测定金属中氧、氮和氢的仪器(EMGA系列)只要用一种载气(He)一块试样,以及作一次操作就能测量三种组分(氧、氮和氢)。该仪器的气路简图示于图1。在分析过
期刊