基于多最小支持度的增量式关联规则挖掘

来源 :中山大学 | 被引量 : 0次 | 上传用户:yinhuali
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是当前KDD中的一个重要领域,它也是现在比较前沿的一个研究,很多算法都还不完善,现在数据挖掘技术主要应用在银行、电力等领域,主要用相关技术进行银行客户信用评价及电力客户信用评价。关联规则挖掘又是数据挖掘中非常重要的一个研究领域,它是由购物篮分析问题被提出的,从提出到现在研究人员对挖掘算法进行了很多的改进,同时也提出一些新的关联规则挖掘算法,但是仍然有一些不足的地方,所以本文就发现的一些不足给出自己的解决方案,本文也是基于经典的关联规则挖掘算法——Apriori算法进行算法改进的。本文的主要工作和结论如下: (1)本文就现实世界中事务出现频率不一致和数据量是不断剧增的问题进行讨论,在经典的关联规则挖掘算法基础上,结合多最小支持度和增量式关联规则挖掘的各自缺陷,提出基于多最小支持度的增量式关联规则挖掘算法,应用最小项支持度可以挖掘出一些稀有项,而这些稀有项对客户来说又是非常重要的信息,由于在多最小支持度的概念下,剪枝函数不满足向下封闭性,所以能够保证在更大的项集上是频繁集的项不会被删除。 (2)传统的关联规则挖掘算法不能做增量式的挖掘,总是进行重复性的扫描数据库、重复性的挖掘,并不能保存以前挖掘的结果,而改进算法很好的解决了这些问题,而且改进算法随着数据量的增加会有新的规则出现,这也是算法改进的一个很重要的方向。 (3)将改进算法应用于电力客户信用评价项目,先用德国信用数据库对算法进行仿真实验,从有效性和实用性两方面对改进算法进行了全面的实验分析和检验,然后将改进算法应用于项目中,实验表明改进算法达到了这两方面的要求,能够有效的挖出一些稀有项而不会产生大量的无用规则,从挖掘结果中能够得到客户信用好坏与哪些因素有关,而且以简单易懂的形式给出结果,有效的辅助电力公司制定相关政策。
其他文献
Alexander基于对数价格时间序列提出了采用协整方法研究指数跟踪问题,李俭富基于水平价格时间序列在不允许卖空条件下对国内市场进行了实证研究。本文根据中国证券市场深证成
上官建云———阳城县次营镇南次营村党支部书记。他是一位普通的村支书,但他肯定不是一位平庸的村支书。10年前,也就是1994年党的生日前两天,上官建云在全村党员干部和群众
优化问题存在于许多领域,对于国民经济的发展也有巨大的影响。随着优化对象在复杂化和规模化等方面的提高,基于严格机理模型的传统优化方法在实施方面变得越来越困难。人工鱼
本文研究了复单位球BN的某些全纯函数空间上复合算子的性质,内容包括加权Hardy空间上,主要是经典的Hardy空间H2(BN)和标准加权Bergman空间A2γ(BN)(γ>-1)上线性分式复合算子的
回顾由Hilbert,Hardy和其他数学家们发现的经典的不等式的同时,本文探讨了分析、数论和算子理论间的多种值得关注的联系。我们将首先应用Hilbert不等式计算各种多重的Zeta值,再
本文主要研究了一类由稳定的子系统组成的切换线性系统的稳定性与鲁棒稳定性. 本文主要从两个方面研究了这类切换系统的稳定性: 一方面,在驻留时间法、平均驻留时间法的基
辐射传输方程的正问题在大部分情况下无法求得解析解,需要采用数值方法或近似方法进行求解。随着计算机硬件的发展,DOM、MonteCarlo算法等数值方法能够解决的问题规模越来越大,
“稚化”是指在教学活动中,有意识地退回到与学生相仿的思维状态,把熟悉的当成陌生的,把再次授课当成首次接触设身处地揣摩,切合学生心态的一种教学。教师在教学中扮演着双重
随着科学技术的进步,非线性问题逐渐引起人们的关注.无论是在核物理、天文学、流体力学方面,还是在航空航天技术、生物技术等方面,非线性微分方程边值问题与它们都有着密切联
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊