数据挖掘中的关联规则算法及其应用

来源 :西安交通大学 | 被引量 : 0次 | 上传用户:ouerfadaide
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据采集技术的不断发展,使得我们可以获取海量的数据,数据库的储存和检索功能已变得越来越强.但是随之而来的问题是:如何才能从这些海量数据中提取出有用的信息和知识呢?20世纪80年代后期,数据挖掘技术应运而生,它能从大量的数据中提取对决策者有用的信息.数据挖掘技术不断发展,已出现很多分支.20世纪90年代初,R.Agrawal等人提出了关联规则挖掘技术.关联规则挖掘是为了发现大量数据中项目集之间感兴趣的相关性信息.经过十余年的发展,关联规则挖掘已经成为数据挖掘技术中较为成熟并很重要的一种方法.该文首先阐述了数据挖掘技术和数据挖掘工具的发展概况,系统描述了关联规则挖掘所涉及的概念;关联挖掘算法数十年来发展迅速,该文介绍了关联规则算法的历史沿革;通过定义匹配、连接和修剪这三个基本操作,详细描述了关联规则挖掘中的三个重要算法:Apriori算法、DHP算法和FP-growth算法;在关联规则同其它数据挖掘分支的交叉领域,介绍了关联规则分类,结合粗糙集中的知识约简思想,提出集成属性约简和关联规则的分类方法;在应用方面,该文侧重于关联规则挖掘算法在数据挖掘系统中的应用,结合863课题,讨论了分布式计算环境下数据挖掘系统的结构,并将关联规则算法组件化,应用于电信营业部门的历史数据,在这样的数据挖掘平台中,关联规则挖掘组件具有很好的升级性和易用性.
其他文献
分形图像压缩编码是图像编码领域中较新的技术。本文通过对传统分形图像压缩编解码的分析,提出了门限变化和生成函数改进的编码算法,此算法在一定程度上与人类视觉系统特性相符
粗糙集理论是20世纪80年代初由波兰数学家Pawlak Z.提出的一种用于数据分析的数学理论,已在机器学习、模式识别、决策分析、过程控制、数据库知识发现、专家系统等领域获得成
近年来,复杂网络在很多领域都获得了大量的关注.研究者们对复杂网络系统也给予了极大的关注,并取得了许多研究成果,包括网络控制、可靠性分析和状态估计等.由于动态系统的状态估计
随着科技的进步,数字图像越来越容易获取和传输.为了有效管理数量激增的数字图像,人们对图像检索技术作了大量研究.该文首先回顾了现在已经发展比较成熟的基于内容的图像检索
基于高性能计算机的大规模并行计算在科学研究和工程技术领域已被广泛应用,并逐渐发展成为一门新的学科——大规模科学与工程计算.该文分别讨论了电磁学中改进的MEI方法和两
该文主要做了以下一些工作.在神经网络理论研究方面,我们对二层前传神经网络在线梯度法(OGM)的收敛性定理进行了论证,将已有的结果推广到包括重要的相对熵函数在内有很广泛的
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,被积累的数据越来越多,激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更深入的分析、研究,从中得到更有
幂等元的研究是半群代数理论的主要研究课题之一,并且半群中幂等元的性质将从整体上影响着这个半群的结构.该文主要对非负矩阵半群的两类子半群—双随机矩阵半群D和随机矩阵
半群的半直积及其推广形式是研究半群的结构以及分类的重要工具.该文首先研究了幺半群半直积上的同余,通过导出的同余定义了同余可分解,进而给出同余分解的充分必要条件.对幺
微带加载天线的分析与研究是微波天线领域中的热点问题之一.已有文献鲜有对该问题的全波分析,且从已有结果看,计算结果比较粗糙,特别是加载端口处和实测结果相差较大.针对这