论文部分内容阅读
随着数据的大量积累和市场竞争的日趋激烈,人们对知识和信息的需求越来越迫切。数据挖掘技术可以发现隐藏在数据中的信息,进而找到尚未发现的知识。这些隐藏在数据中的信息是人们的先验知识和经验无法确定和预测的,所以数据挖掘的出现为商业竞争、企业生产和管理、政府部门决策以及科学探索等领域提供了诸多帮助。由于它的实用性和商业价值,近年来成为人们研究的热点并研究出许多数据挖掘的算法。数据挖掘不仅能对历史数据进行查询和遍历,并且能够找出这些数据之间的潜在关系,从而促进信息的传递。规则挖掘应运而生。它是指从数据库中抽取隐含的、潜在的、先前未知的、有用的知识或者规则。作为一个年轻而又活跃的前沿技术领域,许多新兴工程领域和传统学科相结合,使规则发现的相关技术逐步成为多种智能控制系统的重要组成部分。在此,重点研究了规则挖掘的主要相关技术,并进行了几种技术的比较。规则挖掘作为数据挖掘中一个重要的课题,最近几年已被业界所广泛关注和研究。由于其巨大的的应用价值和潜在的理论意义,世界各国都投入了大量的人力、物力、财力进行了深入的研讨。本文针对流程工业生产过程的复杂性、强关联性、非线性、以及不确定性的特点,结合流程工业中的历史数据,进行了规则挖掘相关技术的学习和研究,并着重研究了粗糙格。粗糙格是概念格和粗糙集的结合。概念格和粗糙集是数据挖掘中对数据进行分析和知识提取的有效工具。粗糙格理论的提出,克服了概念格过于精确和粗糙集不完备的缺点,使两者结合起来弥补各自在数据挖掘方面的不足,推广了粗糙格的应用领域。结合两者的优点,在决策背景的基础上,根据CARCL算法,本文提出了缩减矩阵的粗糙格构造方法(CM_CARCL),解决了粗糙格构造过程中的冗余问题。为了验证基于缩减矩阵的粗糙格构造方法的有效性,本课题详细研究了水泥的流水线生产过程,并把此算法应用于水泥生产的整个环节,进行规则挖掘。为了减少粗糙格结点的构造数量,本文还对这些结点进行了筛选,以简化构造过程。实现过程采用Eclipse技术进行编程,缩减矩阵的应用大大降低空间复杂度,减少并规整了程序的执行模块。在流程工业中,应用基于缩减矩阵的粗糙格的构造算法,能较好的得到相应的规则。根据挖掘出的规则,人们就能方便的找出各个流程环节之间的联系,适当的调节与控制流程工业中的某些对象的属性,达到人们期望的结果。