基于粒度分析原理的模糊聚类算法研究

被引量 : 5次 | 上传用户:waich19870625
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为一种非监督学习方法,是智能计算领域中一个重要的研究方向。同时,聚类技术也是一种数据挖掘中进行数据处理的重要分析工具和方法。随着现代信息技术的飞速发展,聚类分析在机器学习、模式识别、数据挖掘、智能计算、信息检索等很多领域中成为人们的研究热点。聚类模型和聚类算法的设计是整个聚类分析过程中最关键的步骤,设计不同的聚类模型,就可以得到不同的聚类算法。目前出现的聚类算法主要有:基于层次的方法、基于划分的方法、基于密度的方法、基于网格的方法和基于模型的方法等。聚类分析本身隐含着粒度的思想,因此,近年来聚类算法与粒度分析原理相结合的研究引起了国内外的广泛关注。本文介绍了聚类分析与信息粒度的基本概念和基础知识,对聚类分析的典型算法及其基本思想进行了归纳、分析和研究。结合信息粒耦合度与贴近度测度,将粒度分析原理引入到聚类算法中,对模糊聚类算法做了进一步的研究,主要研究内容包括以下三个方面:(1)本文基于最小平方误差原理给出了一种信息粒耦合度测度与贴近度测度的定义,通过计算信息粒的耦合度与贴近度,从不同的粒度空间对信息粒度的有效性进行评价。(2)在给定最大初始聚类个数的基础上,通过基于确定类别数的最大最小距离算法构造初始聚类中心,引入数据点到聚类中心的隶属度对数据集进行聚类,应用信息粒耦合度测度与贴近度测度对聚类结果进行评价,采用模糊迭代方法得到较优的聚类结果,同时也找出了最佳的聚类个数。(3)用IRIS标准测试数据集和模拟数据集分别对算法进行了比较实验,其实验结果表明本文提出的算法比传统最大最小距离算法和模糊C均值聚类算法有更好的聚类效果,从而证明了本算法的有效性。本文将聚类算法与粒度分析相互结合,并引入信息粒耦合度与贴近度测度对聚类结果进行评价,使得本文提出的算法取得了良好的效果,不仅对模糊聚类分析理论研究具有促进作用,而且所获得的成果具有重要的应用价值。
其他文献
目的:研究痛风安胶囊对高尿酸血症大鼠血尿酸水平的影响。方法:将60只大鼠随机分为空白对照组、模型组、秋水仙碱对照组、痛风安胶囊高、中、低剂量组。采用次黄嘌呤致大鼠高
文章主要研究我国商业银行(下文所称"银行"如无指明均指商业银行)应如何整合传统商业银行业务与新兴投资银行业务,以更好地支持中小企业发展。在整理和评述有关文献的基础上,
金丝桃素为萘骈二葸酮类化合物,存在于贯叶连翘及同属植物。金丝桃素是贯叶连翘中最具生物活性的物质,可由两分子大黄素缩合而成。据研究证明,金丝桃素具有多种生物活性:(1)
研究生创业教育是研究生培养模式转变的一个重要问题。本文对当今研究生创业教育现状进行了阐述,具体分析了研究生创业教育发展的环境、管理、评价、教学、目标等诸多约束因
湿地被誉为“地球之肾”,是自然界最具生产力的生态系统和人类最重要的生存环境之一。但是由于不合理的开发利用,湿地在世界范围内面临着大量丧失,因此各国政府正致力于湿地保护
20世纪后半叶,体育事业与大众传媒产业快速发展,极大地促进了体育信息传播体系的发展完善。大学生作为一个特殊的社会群体,他们接受新事物、新观念、新知识能力比一般社会青
多因素综合评价法能全面考虑各种与土地质量直接相关的因素,不仅包含了影响土地价值的经济因素,而且包含了其他因素。本文在分析已有文献的基础上,构建了针对城市土地综合定
随着我国对外贸易的不断扩大,港口在国民经济中的地位和作用变得日益重要,各个港口之间的竞争也日趋激烈。因此,各港口必须不断地提高自身效率,即将投入转化为产出的能力,才
供应链管理是一种先进的管理模式,而构建供应链的首要问题就是合作伙伴的选择,在当前的竞争环境下,供应商的选择是供应链构建过程中一个十分重要的环节。作为一项较为复杂的
在市场经济条件下,如何在企业建立一种有效的激励与约束机制,是当前人力资源管理的一项重要课题。本文试图从理论和实践两个方面探讨股票期权在企业薪酬改革中的激励和约束作