【摘 要】
:
关联规则挖掘是数据挖掘的一个重要组成部分,频繁集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。本文分析和研究了两种著名的频集算法Apriori和F
论文部分内容阅读
关联规则挖掘是数据挖掘的一个重要组成部分,频繁集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。本文分析和研究了两种著名的频集算法Apriori和FP-growth,指出了它们各自的优缺点。并提出一种基于Apriori的改进算法G_apriori。本论文所做的主要研究工作如下:(1)概括了数据挖掘和Web挖掘的相关概念、定义、结构、分类、特点等,介绍了面向电子商务的Web挖掘的过程、技术、个性化推荐服务。研究了常见的关联规则挖掘算法,给出关联规则挖掘的相关概念及关联分类和关联挖掘步骤(2)分析和研究了经典的Apriori和FP-growth关联挖掘算法,研究了算法思路,算法描述,分别举例分析了该算法的执行流程,分析比较了这两种算法。并提出一种基于Apriori算法的改进算法G_Apriori。给出了的算法的设计思路,算法描述,以及实例运行过程。针对Apriori算法在执行过程中多次扫描数据库,大大降低了算法的执行效率的缺点,G_apriori算法在执行过程中只需扫描一次数据库,且产生的候选项集数目要远低于Apriori算法所产生的。(3)设计了一个面向电子商务推荐系统的模型,并给出该模型的系统结构图,分别详细给出离线模块和在线模块的结构设计思想及各模块的功能说明,最后举例详细说明G_Apriori算法在推荐系统中的应用过程。
其他文献
随着光通信技术的飞速发展,光网络向着大规模、复杂拓扑、面向业务的智能化网络方向发展,对网络的生存性提出了更高的要求。为了定义网络的管理边界、提高路由和信令的性能、
图像工程根据研究方法的不同可以分为三个层次:图像处理、图像分析和图像理解,图像工程是三者的有机结合及它们工程应用的总称。图像滤波和边缘检测技术是图像分析和处理的基
植物叶片识别对于相关植物知识的普及和植物学相关学科的发展有一定的促进作用,对于研究植物的系统的进化具有很重要的意义。近年来,国内外在植物叶片识别方面的研究取得了很
自动抄表系统利用现代通信和计算机技术实现对远程流量计量器的实时监控与数量采集,提高企业的运营效率,方便用户的使用。自动抄表系统中数据收集转发器保障外部设备与远程流
电子商务的大繁荣使得数以万计的用户开始通过网络购买各种产品、服务,并在线发表评论信息。许多消费者在购买某种产品或服务的时候,通常会先参考之前购买者的评论信息,获得直观
半监督学习是近年来倍受人们关注的新的机器学习方法,本文将李群理论引入到半监督学习领域中,给出了基于李群的半监督学习算法。主要包括以下几方面内容:1.分析了半监督学习
伴随信息技术的发展以及无线通信设备普及,移动学习(M-Learning)应运而生。移动学习是一种新型的学习方式,它充分利用无线技术和移动计算机设备来辅助教学,为学生通过移动设
自动交换光网络(ASON,Automatic Switched Optical Network)是下一代光网络的发展方向。随着ASON网络规模日益扩大,如果将所有网络设备放在同一路由域内来管理,则单个节点需
调试在程序的开发与维护阶段占据相当大的比重,而定位错误则是调试过程中至关重要的一个步骤。由于手工定位错误往往缺乏导向性,因此需要耗费程序员大量的时间和精力,而且往往效