模糊聚类分析的有效性研究

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户:sirius1394
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会已发展成为信息化的社会。信息一般是以数据的形式存在的,数据是信息的载体。因此数据对于信息化社会是相当重要的。大量的数据存在于数据库中,需要使用一定的方法对其进行分类。其中重要的一个分支就是聚类分析。聚类分析的基本原理通俗的来说就是“物以类聚”的原理,就是将一个数据样本根据某一属性值分为相似的“类”的过程。同一“类”中对象彼此相似,而与其它“类”中的对象相异。传统聚类分析方法对“类”的划分要求较为严格,一个对象通常只能属于某一个“类”。然而在现实客观情况下,有些客观对象却具有属于多个“类”的性质,因此对其划分不能用硬性的标准,而要使用“软划分”。于是模糊理论就被引入到聚类分析中来了,使用模糊理论能够从理论上很好的支持这种“软划分”。通常情况下,聚类分析是在无监督的状态下进行的分类。如何对聚类分析中“类”的划分情况是否符合客观事实进行评价。一般来说采用的是有效性评估,即模糊聚类的有效性问题。在模糊聚类中,由于有效性问题研究不便,因此一般用最佳类别数的决策问题来对其进行替代处理。本文首先对模糊聚类有效性的研究历史、研究现状等进行了总结。然后对模糊聚类分析的有效性指标进行了深入的讨论,主要有以下三类指标:根据数理统计中方差分析提出了基于F统计量的有效性指标,能够反映类内紧密程度和类间的分散程度;为了保证分类程度更高,突出较小的统计量的影响,提出了混合统计量的有效性指标,针对多维数据情况的推广,立足于样本数据集的“类”内部统计信息和“类”外部之间的统计信息,提出了伪统计量的有效性指标。为了论证有效性指标的可行性,本文应用一组地质数据进行了详细的论证。首先运用模糊聚类分析的方法进行分类,然后分别应用多元分析中的统计量、混合统计量及伪统计量的有效性指标进行运算,对数据变化量的大小进行分别分析,以得出模糊聚类的有效性的结果。经过运用三种有效性指标的比较,判别出更合理,更贴近实际的结果。
其他文献
中小企业私募债券作为一种新出现的融资工具,因其速度较快、融资成本较低等特点,为资本市场所青睐。但随着发行完成与起息期开始,该项工具在我国的运用也出现了一些值得思考
为了掌握机翼不同形态下的过冷水滴运动轨迹,采用有限体积法求解欧拉方程,计算出翼型的外部流场参数,然后采用拉格朗日法、标准四步龙格-库塔格式计算模拟过冷水滴在流场中的
随着经济社会的快速发展以及相关设计规范的更新换代,先前建造的那批建筑物在安全性,适用性和耐久性方面已经越来越不能满足人们在生活和工作上的需求,大批缺陷的建筑如果直
1929年举办的西湖博览会是杭州建市之初的一件盛事,在杭州的城市发展史上具有里程碑式的意义。90年前的办展档案是否还有留存?当年的观展人次真的能达到2000万人?博览会纪念
干式双离合器滑摩温升过高会导致摩擦性能降低,实时温度模型的建立与过热保护策略的应用是干式双离合变速器研发的难点和重点.基于热学原理和干式双离合器结构,分析了各热学
基于激波的靶标测量系统是利用声学定位算法和硬件处理系统对声信号进行采集处理,来确定声源目标位置的一种技术。不论在军事领域,还是在民用领域中都具有广泛的应用前景。在
<正> 唱歌是一种美育,是向儿童进行全面发展教育的一个组成部分。教好小学唱歌,可以培养儿童高尚的共产主义道德品质和爱美审美的情操,使他们获得听音、发音、歌唱等方面的初
在热带地区,加强公共卫生害虫的防控,以减少由这些昆虫为媒介而传播感染的疾病的发生,已成为当务之急。由蚊子传播的疾病,如疟疾、淋巴丝虫病,以及登革热、登革出血热、乙型脑炎、
目的探讨对肺癌患者选择支气管动脉灌注化疗+栓塞化疗方法治疗后获得的临床效果。方法方便选择该院2015年11月—017年2月收治的143例肺癌患者作为实验对象;数字奇偶法分组后
一直以来,在学习高中区域地理相关知识的时候都会发现其中涉及的内容不仅广泛而且杂乱,针对这种学科特点,教师能做的就是采取恰当的教学方法来帮助学生打开一条学习区域地理