基于密度期望和有效性指标的K-均值算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:awangvip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统尽均值聚类算法虽然收敛速度快,但存在聚类数后无法预先确定,并且算法对初始中心点敏感的缺点。针对上述缺点,提出了基于密度期望和聚类有效性Silhouette指标的K-均值优化算法。给出了基于密度期望的初始中心点选取方案,将处于密度期望区间内相距最远的石个样本作为初始聚类中心。该方案可有效降低尽均值算法对初始中心点的依赖,从而获得较高的聚类质量。在此基础上,可进一步通过选择合适的聚类有效性指标Silhouette4指标分析不同后值下的每次聚类结果,确定最佳聚类数,则可有效改善k-值无法预先确定的缺点。实验
其他文献
漳州林业经济发展初探江荣山,苏全兴,王明进一、漳州林业发展的指导思想漳州地处闽南经济开发区,自然条件得天独厚,素有“天然大温室”之称,是发展速生、丰产、优质、高效、创汇型
基于签密方案,Liu-Xu构造了一个高效的无证书两方认证密钥协商协议。对Liu-Xu的方案进行安全性分析,指出由于传送消息存在冗余,该方案不具有强安全性。该方案不能抵抗被动攻
关于周宁县发展竹业经济的思考陈星加快周宁县山区经济发展,竹业开发潜力很大。竹业生产投资少、见效快、市场广、效益高、风险低,是山地综合开发、农村脱贫致富奔小康的很好项
事件序列上挖掘情节规则,旨在发现情节之间的因果关系。基于非重叠的最小发生的支持度定义及深度优先搜索策略,提出在事件序列上挖掘无冗余情节规则的GFExtractor算法。利用非
山区林产工业发展对策研究邓煌基山区林业是山区经济发展的支柱产业。当前山区林业正面临着新的发展选择。最为关注的焦点就是山区林产工业的发展速度、规模和水平问题。本文
通过定义决策系统上的公式,引出了粒和粒计算的概念,建立了决策系统与粒计算的联系,得到了决策系统的条件划分,从而以粒计算为支撑,对决策系统进行了分解,生成了若干划分子系统,促成
加强国营采育场经营管理的几点看法陈隆安,吕刚毅建瓯县的国营采育场大部份是五十年代末期建立起来的。经过三十多年的发展,采育场逐步形成了一定规模和经营实力。但是,也应当看
深化木材流通体制改革,是三明林业发展和森林资源保护所面临的一项重要课题。根据考察,本文在分析三明林区木材流通现状和问题的基础上,对今后三明林区木材流通体制的深化改革提
国营林场森林资源资产化管理探讨潘金生,黄登银实行森林资源资产化管理是社会主义市场经济体制下的大势所趋,作为具有独立实体的国营林场,将如何适应这种形势的发展?本文就国营林
<正> 林业多种经营指除营林、木材和竹材经营及其加工、林产化工以外的其它经营。它包括“大林业”系统茶、桑、果,林副产品及其加工,以及林业系统内非林产业。发展林业多种