论文部分内容阅读
随着现代化水泥厂新型干法水泥生产工艺的日益普及,人们迫切需要对水泥产品质量进行有效的控制,从而能够有效节省成本和提高水泥熟料质量。现阶段水泥厂熟料优化策略大部分还是停留在人工经验上,本文尝试把聚类算法引用到水泥熟料质量分析中去,找到水泥质量等级和生产工艺参数之间内在的关系,从而为控制和优化熟料质量打下良好的基础和铺垫。现阶段产品质量预测方法多种多样,面对着现代化工厂后台DCS采集过来的成千上万个实时监测数据,神经网络建模预测、模糊规则建模、模糊聚类分类建模成为首选的建模方法,但是如果对建模速度和经验知识都有要求的话,半监督模糊聚类建模的优势会凸显出来,它既可以区分那些和熟料质量密切相关的检测参数又可以兼顾经验知识来动态实时修正算法。本文主要是详细研究了熟料质量等级的聚类分析过程,先后采用无监督FCM、半监督降维和半监督FCM对熟料质量等级进行分类,并最终转化成规则化的熟料质量模型。关键的建模技术点有:降维算法、聚类算法;核心的算法有:模糊聚类算法、半监督FCM算法。关键的控制参数是:数据优化和过滤技术、标签选取方法、监督信息比重参数。具体算法上,引入了两类监督信息来改进无监督模糊聚类算法:一类是成对约束数据,目的是为了降低数据维度和改善空间相似性,一类是标签数据,目的是为了初始化聚类中心和修正聚类目标函数;经实际生产数据验证,改进后的算法可有效提高建模准确率、降低聚类维度和缩短计算时间。本课题主要做的工作归纳起来有以下几个方面:(1)分析了数据挖掘、半监督聚类算法和水泥熟料质量的研究现状。(2)研究了模糊聚类理论,并给出了一般化的模糊聚类模型。(3)在新干法水泥生产工艺研究基础上运用统计分析手段得出了水泥质量等级的划分标准,并用相关度分析、神经网络重要性分析抽取出与质量等级相关的一系列特征变量,在此基础上借助数据挖掘工具完成了原始数据过滤工作。(4)研究了无监督模糊聚类算法,并运用优选函数,完成了无监督FCM算法中参数值c和m的迭代寻优过程,并加入了已知样本点来辅助判断类别标号,最后用优化后的FCM算法对水泥产品质量进行聚类分析,聚类预测结果表明类别2和类别3单独靠无监督聚类没办法做出很好的区分,类别局部信息上单独靠FCM无法完全识别。(5)为了克服上面聚类算法中的缺点,本文将两类监督信息加入到模糊聚类算法中去,加入成对约束构建的投影矩阵是为了改变距离测度函数和提高迭代效率,加入标签数据则是为了改变初始参数和目标函数,从而指导整个聚类过程;最后为了便于分析模型的具体结构,在FCM相似性判断的基础上构建了最终的模糊规则模型。(6)根据水泥实际生产状况,分析了降维维数和监督信息比重对模型的影响,在选取最优的半监督模糊聚类控制参数的基础上,设计出了半监督模糊聚类建模MATLAB程序,实验结果表明,和无监督FCM相比较,在模型的输出曲线上、预测准确率、迭代时间和聚类空间结构上,半监督FCM算法都有所改善,它已经能够胜任对样本点的局部识别,并能很好区别类别之间的差异,在聚类空间分布上,数据点的细节分布也有所改善。