基于协同的模糊聚类算法的研究

来源 :长沙理工大学 | 被引量 : 2次 | 上传用户:a15968331849
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于目标函数的模糊聚类算法中,模糊C-均值聚类算法得到了丰富的理论研究和广泛应用。它通过迭代和爬山技术来寻找问题的最优解,是一种局部搜索算法。然而,该算法对初始中心很敏感,易导致一致性聚类。协同聚类算法利用了不同特征子集之间的协同关系,可提高原有的聚类性能。本文将协同聚类算法和以模糊C-均值聚类算法为基础的改进算法结合,来解决特征属性完备性和隶属度取值随意性的问题。本文的主要工作如下:模糊C-均值聚类算法及其改进算法都是基于概率约束的聚类方法,所采用隶属度的取值形式体现了数据集的绝对隶属程度,常出现不理想的聚类结果。本文通过两个基于相对隶属程度的判断准则参数,表示数据对聚类簇隶属关系亦此亦彼的不确定性,将迭代过程中数据集对聚类簇隶属的可能性与不确定性关系引入目标函数中。再与协同聚类方法相结合,提出了一种协同的可能性模糊聚类算法(C-FCA)。该方法先进行特征选择,并对子集的差异性和相识性进行度量,利用不同特征子集之间的协同系数,说明子集之间的关系程度,再采用隶属关系不确定的聚类算法(UMPFCA)在中数据对某个类的隶属度程度不会受到其他聚类中心的牵制。该算法解决了因模糊聚类算法隶属度取值的随意性而导致的实际聚类效果不理想、容易出现聚类中心重合的问题,达到明显的优化聚类结果的功效。理论分析和实验结果表明,相对其他聚类算法,新算法具有更高的聚类正确率。
其他文献
作为组合优化领域与计算机科学中的一个重要分支,装箱问题越来越受到人们的关注与重视。随着科技的发展,组合优化问题在生活中的应用越来频繁,装箱问题的研究得到了飞速的发展,并
随着工作流技术广泛应用于生物信息学实验,其整合分析工具完成复杂生物计算的能力越来越受到人们关注。生物信息工作流通过一种模块化的流程表达方式形象地描述计算分析的过程
近年来,科学技术迅猛发展,信息技术已经渗入社会、经济、生活等各个领域,但信息技术是一把双刃剑,一方面它的便捷性和全球性对经济的发展起到有力的推动作用,另一方面,其自身的缺陷
背包问题在众多工业领域中都能遇到,诸如交通、物流、切割及包装、电信、可靠性、广告、投资、预算分配和生产管理。在这些应用中,背包问题一般作为独立的问题或复杂的子问题出
在软件管理系统中,数据大部分存储在传统的关系型数据库中,但当业务复杂度的提高和数据量的不断增加,简单的通过单一节点的数据库处理方式已经无法满足用户对于希望快速获取反馈
集成学习,是先将样本提供给多个学习模型,再采取投票或是级联等方法把这些学习模型的输出集成起来的学习模型。集成学习采用合成多个学习模型的输出,能够显著的提高学习模型的泛
随着Web2.0的出现和高速发展,互联网中用户所产生的信息容量和用户数量都呈现爆炸性增长的趋势,网络平台已经成为人们日常生活中不可缺少的信息获取、交流和传播的重要媒体。
癌症不是单一类型的疾病,而是存在分子亚型的。其分子的复杂性体现在mRNA、DNA、蛋白质等多层次遗传物质中。仅分析其中一种数据并不能够完整揭示分子亚型的独有特点。  
随着信息化技术不断发展,人类社会进入了信息化时代,各种各样的应用软件也随之应运而生,如ERP、OA、SCM、PLM等。这些软件对企业的快速发展起到了重要作用,越来越多的企业也
随着互联网的持续高速发展和广泛应用,分布式计算取得了巨大的进步,分布式计算技术的新进展和XML技术的出现,最终导致了Web服务技术的诞生。Web服务是一种基于服务提供者和服