一种基于距离-期望密度参数的K—means算法

来源 :山东师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:w359624042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对K-均值聚类算法随机生成初始聚类中心使得算法容易陷入局部最优的局限性,笔者在综合考虑数据集中数据对象之间的相似性和数据对象密度分布特性的基础上,提出了一种基于距离-期望密度参数K-均值初始聚类中心优化方法.该方法将k个相互距离最远并且能够代表样本对象分布的数据对象作为初始的聚类中心,从而使聚类结果更接近于全局最优解.在UCI数据集上对改进算法进行的仿真实验表明,该方法的聚类结果稳定性和准确率均得到了优化.
其他文献
阐述了光学相控阵扫描激光电视的设计,系统采用光学相控阵扫描技术,可以提高扫描速度和装置的稳定性,扫描为直线,不须进行扫描轨迹的矫正.最后通过计算机模拟计算,得出扫描点
随着我国经济的高速发展,亲近自然、回归自然成为了人们的时尚选择。山区景区道路却成为制约景点发展的重要因素,景区道路的改扩建成为众多景区面临的共同问题。山区景区道路
运用原核系统表达牛奶β-乳球蛋白(Bos d5)蛋白,建立一种纳米磁微粒化学发光方法用于检测牛奶组分过敏原β-乳球蛋白特异性Ig E抗体的含量。通过优化合成牛奶β-乳球蛋白基因
目的调查分析某试验基地官兵血清丙氨酸转氨酶升高情况及其影响因素。方法以陆军试验训练基地医院2017年11月20日-12月31日为某基地官兵体检998人为样本,根据年龄、性别、血
考虑一般半相依回归系统的两步协方差改进估计序列,通过引入矩阵范数及矩阵的收敛,可以比较完整地解决两步协方差改进估计序列的收敛性.
道路交通是由人、车、路、环境等要素组成的复杂系统,系统失衡可能会发生交通事故。为客观公正的辨识事故易发路段,基于道路条件对城市道路交通安全影响因素进行综合分析,提
随着7-Zip压缩软件的广范使用,破解7-Zip加密文档的口令对信息安全有着非常重要的意义。目前,破解7-Zip加密文档主要采用CPU和GPU平台,而潜在的口令空间大,计算复杂度高,在有
探地雷达作为一种新兴无损检测技术,在矿山法隧道工程中应用较广。雷达波在介质中传播时,受外部因素干扰较为严重,使得探地雷达探测到的目标体图谱千差万别,导致对数据进行解
采用迎风间断有限元方法对平面二维水沙输运模型进行了数值模拟,并给出了相应的数值算例,