论文部分内容阅读
当今由于市场的激烈竞争,质量变得更加重要。为了赢得市场,企业必须确保其产品质量并能预测产品质量,这样才可以最小化生产中的浪费,实现低成本高质量。在加工过程中,影响因素不是单一作用,它们可能共同作用,这样就存在组合效应。而且过程参数不是始终如一,它们因为受被加工件的影响而改变,如加工工具和夹具且其他相关的事物随着加工会磨损,甚至损坏。工序质量和过程因素的复杂性使得产品质量更加难以控制。如果我们能够发现其中的关联,则会比较容易控制产品质量,实现质量改善、赢得更大的市场。由于多工序生产中有多个质量因素及其复杂的相互作用,以及各因素对工序质量特性的影响程度的数据不充分,所以很难建立一个精确的数学模型,且所创建的模型不够直观。数据挖掘是一种知识发现的技术,其中聚类分析技术是常用的一种挖掘方法,该方法可以根据某些原则在无监督和有监督的情况下将样本分成几类,所得聚类结果的解释性比较好。考虑到工序质量特性数据的庞大性,以及5M1E中各因素对工序质量的影响程度的不确定性、数据的动态性,我们利用数据挖掘的技术方法和动态统计过程控制技术研究工序质量。论文旨在研究工序质量的异常预测与诊断方法。质量控制图是统计过程控制技术中一个重要的方面。可以根据控制图判断质量特性数据的异常情况,进而判断过程异常,但不能定位异常质量因素。本文采取模式识别方法识别质量控制图,利用数据挖掘中的聚类技术对识别出的控制图模式进行聚类,利用统计过程控制技术对质量特性数据进行分析诊断。文中给出质量异常的定义,以及质量预测的过程步骤、异常判断的原理、控制图判断异常的优缺点、聚类方法判断异常的流程及注意事项。利用异常预测模型研究质量控制图的模式,得出质量特性与质量影响因素之间的关系,分析了质量因素变化对质量特性波动的影响。研究质量特性异常与故障元数据的关系,分析了概念驱动的异常诊断原理与诊断过程步骤,以及概念提取理论方法,实现概念驱动的质量诊断。为此确定了数据挖掘技术方法、统计过程控制指标、控制图的模式识别方法、聚类方法的选择、聚类度量标准的选择和聚类有效性的检验,并利用聚类技术确定了质量特性与质量影响因素之间的关系。在预测之前,利用控制图得出质量特性数据的模式,初步判定了过程的异常情况。通过有序样本聚类方法分析过程异常情况与正常情况下的数据模式,得出质量影响因素的组合簇。这种方法实际上是对质量影响因素变量进行聚类。Fisher判别算法是典型的有序样本聚类算法,用作本文的聚类标准,且欧氏距离用作度量标准,分析簇间相异性与簇内相似性得出质量影响因素之间的差异,Hurst指数可用作质量测量值时间序列的自相似性度量,根据各时间序列模式可判断质量组合因素随着时间的变化量。文中通过分析质量影响因素之间的差异以及Hurst指数,获得了质量影响因素对质量特性的影响。通过分析质量异常的表现,给出质量异常的预测方法、模型。为了实现质量预测,首先明确了质量影响因素,分析了质量影响因素及其变化对质量特性的影响。首先对质量特性数据利用控制图划分模式,再利用数据挖掘技术中的聚类技术方法对控制图上各模式进行聚类,聚类标准为控制图模式相似性,将产生同一类模式质量特性的质量影响因素进行比较分析,找出控制图模式与质量影响因素的关联关系,最后根据当前质量影响因素的状态预测质量。为了实现质量控制、质量改善、质量稳定,有必要减少质量特性的波动,即加工所得的值与所要求的值之间的偏差变化范围。关键的是找到波动源并确定其对质量特性的影响。聚类度量标准是评估聚类质量的关键因素。本文中,引入了Pearson相关系数作为相关聚类的度量标准。通过这个聚类度量标准,可以自动进行聚类,无须指定聚类数。方差和均值之间的差异显著性作为相同因素形成的数据聚类的度量。利用该方法进行实现质量诊断。在质量诊断之前首先对质量特性数据和故障元数据进行分析。采用数据挖掘技术中的概念聚类技术对质量特性数据进行聚类,聚类标准为控制图模式相关性,将质量特性数据与故障元数据对比,找出它们之间的关系,之后根据质量特性数据,诊断出问题所在。最后以变速箱壳体加工为例,通过统计过程分析得出各质量影响因素的最佳组合,以及各质量影响因素组合随时间变化的Hurst指数。并利用数据挖掘技术中的logistic回归模型得出各质量影响因素对质量特性数据的影响大小,之后利用聚类技术对控制图模式识别出的新数据样本进行聚类,利用Pearson相关系数作为度量标准,根据利用贝叶斯方法提取的条件概率概念推出了质量特性与故障元的对应关系。实现了质量特性与故障元的对应关系,验证了本文所给的研究方法的合理性。