论文部分内容阅读
数据挖掘技术是人工智能、数据库和统计理论的结合技术,具有较为广泛的应用前景。专家预测数据挖掘在未来十年内会有革命性进展,是商业分析、规则发现、实时识别和分析用户信息的关键技术。 数据挖掘的目的是从数据中找出有意义的模式。模式可以是一组规则、聚类、决策树、依赖网络或其他方式表示的知识。 粗糙集理论是由Pawlak教授于20世纪80年代初提出的一种用于处理不确定性和模糊性知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出分类规则。它无需提供相关数据集合外的任何先验信息,适合于发现数据中隐含的、潜在的有用规律,找出其内部数据的关联关系和特征。近年来,粗糙集理论和应用取得了很大的成功,已成为软计算方法的重要分支,其涉及的领域包括模式识别、机器学习、决策分析和决策支持、知识获取和发现等。 将粗糙集理论应用到数据挖掘技术上,利用粗糙集的知识约简,精简数据挖掘出的各类规则,对复杂系统的智能控制策略研究具有广泛的意义。 本文在探讨粗糙集理论和数据挖掘技术的基础上,就工业过程控制中的几种数据挖掘方法做了研究,主要创新成果有: 提出基于粗糙集理论的启发式约简算法和近似约简算法,进行属性约简和冗余规则去除;同时针对工业过程控制,提出了一种基于采样的近似约简算法,可以快速找到具有较低错误率的近似约简,对实时控制具有现实意义; 利用数据挖掘技术提出工业过程中控制变量耦合度和语言值关联规则的数据挖掘算法,语言值关联规则符合人类思维方式,有利于建立智能控制策略; 数据挖掘过程模型的建立为数据挖掘技术的应用提供了一种系统化的技术实施方法,针对工业过程控制,建立了一种实用的数据挖掘模型;同时利用数据挖掘应用平台,使数据挖掘的研究重点逐渐从发现方法转向系统应用; 软计算技术(包括:数据挖掘、模糊逻辑、神经网络和粗糙集理论等)是解决复杂系统建模与控制问题的重要途径之一。通过粗糙模糊模型、粗糙神经网络模型的建立,对智能控制策略进行了初步探讨。