高效率的K-means最佳聚类数确定算法

来源 :计算机应用 | 被引量 : 140次 | 上传用户:gengfu123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对K-means聚类算法通常无法事先设定聚类数,而人为设定初始聚类数目容易导致聚类结果不够稳定的问题,提出一种新的高效率的K-means最佳聚类数确定算法。该算法通过样本数据分层来得到聚类数搜索范围的上界,并设计了一种聚类有效性指标来评价聚类后类内与类间的相似性程度,从而在聚类数搜索范围内获得最佳聚类数。仿真实验结果表明,该算法能够快速、高效地获得最佳聚类数,对数据集聚类效果良好。
其他文献
以添加Sasobit有机降粘剂的温拌沥青混合料为研究对象,采用浸水马歇尔试验和改良罗特曼试验,对比研究温拌沥青混合料(WMA)和传统热拌沥青混合料(HMA)的抗水损害能力差异。研究结
编辑同志:我是个私营企业经营者,1987年创办了新疆昌吉市昌华装饰建材厂,主要生产干粉涂料、107地板胶。托党的改革开放的好政策,我厂产品不仅在新疆畅销,而且远销甘肃、西藏
Apriori算法是频繁项集挖掘的经典算法。针对Apriori算法的剪枝操作和多次扫描数据集的缺点,提出了基于散列的频繁项集分组(HFG)算法。证明了2-项集剪枝性质,采用散列技术存储频繁2-项集,将Apriori算法剪枝操作的时间复杂度从O(k×|L k|)降低到O(1);定义了首项的子项集概念,将数据集划分为以I i为首项的数据子集并采用分组索引表存储,在求以I i为首项的频繁项集时,只扫描以
通过研究Windows环境下USB设备的工作原理,应用操作系统与USB设备驱动通信获取设备描述和设备ID等信息的机制,提出了一种实用有效的USB设备监控技术。实现了在开机前后两种情况下对USB设备的实时监控,有效地避免了其他监控技术的漏洞。实验结果证明,该方法是可靠有效的。
针对传统基于角色的访问控制(RBAC)管理模型难以表达多样化策略的问题,提出了基于属性的用户-角色委派(ABURA)模型,采用属性作为用户-角色委派的先决条件,丰富了RBAC管理策略的语义。用户-角色可达性分析是验证分布式系统中授权管理策略正确性的重要机制,定义了ABURA模型的用户-角色可达性分析问题,通过分析ABURA模型状态转换特点给出策略约减定理,设计了可达性分析算法,并通过实例对算法进行
为了解决网络中因链路失效而产生的拥塞问题,基于混合蛙跳算法和小波技术提出了一种新的网络生存性评价方法(SASFL)。该方法首先建立了生存性的评价指标,同时针对失效状态下的到达流量进行小波变换,并利用混合蛙跳优化小波系数,以此获得最佳网络剩余流量。最后利用OPNET和Matlab进行仿真实验,深入研究了网络生存性与失效链路、权重系数等参数之间的关系。结果表明,相比其他方法,SASFL表现出较好的适应
十八大以来,中央先后出台了《中国共产党党内法规制定条例》《中央党内法规制定工作五年规划纲要(2013—2017年)》和《深化党的建设制度改革实施方案》等文件,对当前和今后党的建
运用模糊评价法,综合考虑高速公路机电设备的使用寿命、故障率、工作环境、重要性、维护成本和难度等因素确定其升级改造条件,并提出相应的升级改造方案,以有效降低高速公路
层分配是解析式三维集成电路布局算法中的关键一步。解析式布局需要通过层分配将连续的三维空间中的单元划分到二维的芯片层上,这个过程会破坏之前三维空间中得到的连续解。为了实现从优化的三维布局到合法的多层二维结构的平滑过渡,提出一种使用最小代价流的层分配方法,尽可能地继承三维优化结果,保护解空间。将此层分配算法嵌入到多层次的解析式三维集成电路布局算法中,以总线长和穿透硅通孔数目的加权总和为目标,面积密度为
以浮动车数据处理,基于浮动车的路段车速估计、行程时间估计以及交通状态判别和动态路网OD估计为序,对浮动车技术在城市智能交通系统中的应用进行递进式归纳和总结,并探讨目