论文部分内容阅读
近年来,随着计算机技术的不断进步,数据挖掘技术已经在商业、金融、保险、医学等方面得到了广泛地应用,数据挖掘技术的研究也越来越受到人们的重视。因而,本文开展数据挖掘算法的改进及应用研究,具有重要的理论研究价值和广泛地应用前景。本论文的整体结构如下:1、概述了数据挖掘的研究背景、研究现状以及研究进展;简单介绍了数据挖掘的相关知识。2、提出了基于分区的改进Apriori算法(IABP)。该算法采用分区的思想将数据库中的数据集划分成若干分区,采用分而治之的策略来处理整个数据集。该算法只需一次访问数据库,减少了计算机系统I/O瓶颈的限制。同时,利用Apriori的性质在剪枝步骤中删除了大量无需参与运算的数据项,大大减少了产生无用频繁项的机会。对于分区与分区之间有关联的数据项,采用合并的策略,防止因分区而丢失数据项。实验结果表明,该挖掘算法的性能和效率有明显的改善。3、提出了改进的EC算法(IECBE)。该挖掘算法在处理当前窗口数据时,通过学习该数据项是否需要存放到当前窗口中,来减少存储空间的使用,提高了数据项处理的速度。该挖掘算法能够提高数据项结果集的准确性,尤其对分布较平缓的数据项,效果更为显著。实验结果表明,该挖掘算法在很大程度上提高了数据流挖掘的准确率和挖掘效率。4、将改进的IECBE算法,应用于电商平台系统设计与实现中,将其应用到电商的热门产品统计、产品推荐、入侵检测系统的数据筛选。结果表明,将改进的IECBE算法应用于电商系统中,可以为企业带来额外的市场效益。