一种带权的混合数据聚类个数确定算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:zhou75610141
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
混合数据的聚类过程中通常面临一个不可回避的问题:聚类个数的确定。基于Liang k-prototype算法引入属性权重,重新定义混合数据缺失某类的类间熵和(SBAE_M)、有效性指标(CUM)及相异性度量。提出一种带权的混合数据聚类个数确定算法。该算法的基本思想是:用newk-prototype算法将混合数据进行聚类,计算其聚类结果的CUM及SBAE_M,将最坏的类剔除,并将该类中的对象用新的相异性度量进行重新分配,CUM最大时包含的类别数即为聚类个数。在5个UCI数据集上验证了该算法的有效性。
其他文献
中国共产党的九十年是开天辟地的九十年,是造福于民族与人民的九十年。中国共产党的诞生,从根本上改变了中国社会和中国革命发展的方向,揭开了从旧民主主义向新民主主义革命
研究纳米铁酸锌合成及防辐射性能;防辐射性能是现代防辐射材料发展历程中标准的重要衡量方法;传统的防辐射方法多采用化学共沉淀法和微乳液法单分子前驱体法,合成效果差,导致
从一个Word文档实例入手,分析Word文档的组成、VBA中对象的应用区间以及Delphi对Word的支持,并设计一种Word文档中的图片信息向SQL Server数据库进行转换的实现方法,通过这种
目的在给脑卒中患者进行治疗的过程中,利用利用简易康复治疗技术,治疗之后,对患者偏瘫肢体运动功能的恢复效果和治疗术的安全性进行观察。方法选取2016年我院收治的脑卒中偏
目的探讨简易康复治疗技术对脑卒中患者偏瘫肢体运动功能的治疗效果及安全性。方法选择2017年1月—2018年12月前来该院接受诊疗的100例脑卒中患者当做研究对象,并抽签的方式
为探讨各类饱和砂类土的物理特性对其抗液化强度CRR的影响,将具有不同细粒含量FC的福建、南京和南通砂类土分为3组:(1)相同的相对密度Dr;(2)相同的孔隙比e;(3)相同的骨架孔隙
随着社会的发展,物业行业的竞争也日趋激烈。物业服务质量的提高,物业服务行业的可持续发展,精细化与标准化是必然趋势。物业服务企业只有了解并细分客户需求,制定相关的标准
随着我国城市化进程的加速,城市的地震安全问题变得越来越重要,特别是近城镇中强地震对我国众多中小城市的威胁,玉树地震和宁洱地震即是两个典型的震例.城市地震安全问题包括
<正>一、问题的缘起《幼儿园指导纲要》在活动的内容选择中提出:既是贴近幼儿的生活和经验,尊重知识的系统性,与幼儿兴趣、能力相适应的,又有助于拓展幼儿的经验和视野。活动
糖尿病足坏疽是指糖尿病患者由于合并神经病变及各种不同程度末梢血管病变而导致的下肢感染、溃疡形成(或)深部组织破坏,其属中医"消渴病"、"痹"、"脱疽"等范畴。在临床中,糖