一种改进的k—means算法

来源 :北京印刷学院学报 | 被引量 : 0次 | 上传用户:guihaiyidao1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
k-means(k均值)算法是聚类方法中常用的一种划分方法。该算法适合对海量数据进行聚类,对球状、凸形分布的数据具有很好的聚类效果,但该算法有其突出的局限性,少量的孤立点就会对聚类结果产生很大的影响,因此,采用聚类均值点与聚类种子相分离的思想,给出了基于该思想的对k均值算法的改进算法。实验表明,该改进算法比原k均值算法具有更高的准确性。
其他文献
在大数据时代,张量是一种很有效的表示大规模数据的形式。张量之间通过互连所形成的张量网络,由于其利用了高阶结构信息,因此能够有效地缓解大规模数据的维度灾难问题。另一
目的探讨慢性阻塞性肺病急性加重(AECOPD)患者血清对氧磷酶(PON1)、氧化应激与全身炎症之间的关系。方法采用乙酸苯酯法检测40例AECOPD患者和30例正常对照者血清PON1活性;改
应用扫描电镜-X射线能谱对青岛市大气颗粒物定性分析。单个颗粒物分析和多个颗粒物复合分析的结果,为污染源识别和相对重要性的估计提供了重要信息:青岛市大气颗粒物的来源,主要有
为了实现废弃塑料的快速分类识别,利用激光诱导荧光(LIF)光谱技术对不同材质塑料进行分类和鉴别,通过搭建LIF测量系统,使用发射波长为266nm的ND:YAG固体激光器作为光源,Ocean
群众路线是中国共产党的根本工作路线。邓小平和习近平作为中国共产党不同时期领导集体的核心,面对不同的时代任务、现实形势,分别形成了他们自己的群众观。两者有许多共同点
由于各种颜色设备所能表现的颜色范围(即色域)各不相同,为实现彩色图像的复制就需要使用色域映射技术和算法.基于色域映射的重要性,介绍了色域映射的相关问题和各种映射算法,并
2月底,海德堡公司宣布推出采用新型Anicolor输墨装置的SM52速霸胶印机,提供了新的短版胶印解决方案。据称,新型Anicolor不分区短墨路供墨装置将于2007年初投放市场。
由于残疾人属于特殊群体,其在心理上存在一定的自卑感,再由于家庭经济条件的限制,接受教育程度不高,致使残疾人素质能力低下已经成为普遍现象,残疾人自身素质能力和劳动能力
目的探讨中、西医综合康复方案治疗急性脑出血的临床疗效和效价比。方法采用多中心、随机对照试验的设计方法,258例患者分别用中医综合康复方案(中康组125例)和西医综合康复
由中国新闻出版总署、北京市人民政府、国际期刊联盟主办的第36届世界期刊大会,于2007年5月14日在北京开幕。来自全球45个国家和地区的1000多位期刊出版业精英汇聚一堂,把脉世