论文部分内容阅读
聚类分析作为一种非监督学习方法,随着现代科学特别是计算机科学的发展,已经被广泛应用于人们的生产、生活领域。在理论研究及实践应用中,人们己经相继提出了许多聚类算法,但每种算法在具有某种优点的同时也存在着某些不足,可能适合于处理某类问题却无法处理另一类情况,到目前为止仍没有普遍适用的聚类算法。模糊C均值聚类(FCM)作为现有聚类算法中理论最完善、应用最广泛的一种聚类算法,也存在着诸如循环迭代容易陷入局部极值点、随机确定聚类类别数带来的不确定性、算法收敛速度较慢等缺点。本文分析了FCM算法有待完善之处,并有针对性的探讨了FCM在聚类类别数的确定和算法收敛速度两方面存在的不足,研究了一种基于密度函数和S-FCM的改进聚类算法,并将其应用于软测量建模当中,论文主要做了以下的工作:首先,综述了聚类方法的研究背景和软测量技术的理论基础,分析了聚类分析的发展历史和研究现状,简要介绍了聚类分析四种类型的实现思路及待改进之处,并说明了聚类分析的一般步骤及注意要点。然后,介绍了模糊聚类的产生和发展,并根据实现方法的不同,描述了四种聚类算法的实现思路。详细研究了目标函数的建立、HCM和FCM算法的实现步骤及应用。简要分析了FCM算法存在的主要问题。其次,介绍了几种模糊聚类有效性指数,给出了聚类的具体流程。提出了本文的改进算法——基于密度函数和S-FCM的改进算法,此算法从聚类初始类别数的确定和算法收敛速度方面对FCM进行了改进。通过Matlab实验得出的数据和图像证明算法的有效性。再次,围绕软测量技术的定义、用途以及数学描述进行介绍,并重点对软测量建立的步骤进行了描述。对软测量模型建立给予较为细致的分析,叙述了目前软测量研究过程中的几种较为常见的、完善的方法的实现过程。最后,研究了建立软测量模型的BP网络法、RBF网络法及部分最小二乘法(PLS),以及能对数据降维处理的主元分析法(PCA)。并利用本文提出的改进聚类算法对现场采集的氧含量数据进行分工况聚类分析,再将所分的三类数据分别用BP网络、RBF网络和部分最小二乘法进行软测量建模。