论文部分内容阅读
所谓聚类是指按照事物的某些属性,把事物聚集成类,使类间的相似性尽量小,类内相似性尽量大的一个无监督学习过程。聚类分析在经济管理及工程等许多领域有大量的实际背景。在聚类分析中,如果聚类信息(一般指聚类对象特征指标值或相似矩阵以及指标权重)是精确数值的,那么相关的聚类分析方法具有十分丰富的研究成果。但在许多实际问题中,由于被聚类的信息估计不精确或测量的误差以及人为判断等原因,常常以区间数、三角模糊数、语言短语以及不完全信息等这些不确定性信息的形式出现。因此,针对具有不确定性信息的聚类分析方法进行研究,无论是在理论方面,还是在应用方面,都具有重要的意义。为此,本文针对具有不确定性信息的聚类分析问题,进行了相应的理论与方法研究,主要工作概括如下:(1)提出了基于区间数信息的模糊聚类分析方法。具体地,包括基于风险态度因子的区间数聚类分析方法、基于区间数多指标信息的FCM聚类算法和基于区间数多指标信息的最大树聚类分析方法。
(2)提出了基于三角模糊数信息的模糊聚类分析方法。具体地,包括基于三角模糊数多指标信息的FCM聚类算法和基于三角模糊数多指标信息的最大树聚类分析方法。
(3)提出了具有不确定性语言评价信息的多指标聚类分析方法。包括给出了基于语言评价信息的FCM聚类算法和分别将语言评价信息转化为二元语义或三角模糊数的形式后的编网聚类法。此外针对群体语言评价信息分别提出了基于群体语言相似矩阵的群聚类方法和基于特征指标语言评价信息的最大树群聚类方法。
(4)提出了具有多指标信息不完全的聚类分析方法。针对具有不完全信息的多指标聚类分析问题,通过建立优化模型,将不完全信息转化为完全信息的形式,并进而给出了基于多指标信息不完全的聚类分析方法。
(5)给出了一个将本文提出的基于不确定性信息的聚类分析方法应用于企业员工知识共享能力分类问题的实例。
在论文最后,总结了本论文的研究成果和结论。同时也指出了需要进一步研究的工作。