论文部分内容阅读
数据挖掘(Data Mining)是致力于数据分析和理解,揭示数据内部蕴藏规律的技术,它是目前信息技术应用的热点之一。本文通过构建现场数据采集系统,采集生产线的相关数据。利用数据挖掘技术发现这些数据中蕴藏的规律,有利于掌握生产数据变化规律和趋势,对丸剂湿度预测、生产控制方面有重要的现实意义。
本课题在前人研究的基础上,用动态连接库技术开发了一套针对丸剂干燥生产线的数据采集系统,实现了对进口温度、三个排气口温度、输送带速等变量进行在线数据采集。利用数据挖掘的思想,结合SAS分析软件系统所提供的一些成熟的数据挖掘方法,建立了基于Visual Basic数据挖掘的丸剂湿度分析、在线预测、控制系统。该系统提供丸剂湿度预测手段,它通过进口温度、三个排气口温度、输送带速等影响丸剂湿度的主要因素的数据来预测丸剂的湿度大小。文章首先对生产数据进行分析,针对生产数据的预处理相关技术。通过数据预处理技术,得到高质量的数据,并对数据进行了相关性分析,并根据数据可能存在误差的情况,在挖掘模块中建立了两种丸剂湿度预测方法:回归分析和偏最小二乘回归分析,其中偏最小二乘回归分析降低了数据中可能存在的误差数据对预测结果的不利影响,从而使该系统具备稳定性和通用性。
文章最后通过生产数据进行实证分析,并通过测试评估验证了不同预测方法的误差情况,两种分析方法都能满足生产的预测要求(生产要求湿度误差<10%)。偏最小二乘回归方程的预测误差比多元回归方程的预测误差相对平稳,多元回归方程的预测误差波动较大,因此本系统采用了偏最小二乘回归分析方程作为在线预测模型。该系统的预测稳定性为丸剂预测和控制领域的提供了一个可参考的数据挖掘过程以及丸剂生产控制过程。