基于离群点检测的K-means算法

来源 :渤海大学学报:自然科学版 | 被引量 : 0次 | 上传用户:yuanyewyew
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-means算法以其简单、快速的特点在现实生活中得到广泛应用。然而传统K-means算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度不高。针对这个问题,提出一种基于离群点检测的K-means算法,首先检测出数据集中的离群点,在选择初始种子的时候,避免选择离群点作为初始种子。然后在对非离群点进行聚类完成后,根据离群点到各个聚类的距离,将离群点划分到相应的聚类中。算法有效降低离群点对K-means算法的影响,提高聚类结果的准确率。实验表明,在聚类类别数给定的前提下,在标准数据集UCI上该算法有效降低离群
其他文献
夫妻激情遭遇时,天有不测风云 我和妻子玉婷是1994年结婚的。婚前我们相恋了5年之久。从高中二年级一直到大学毕业,这段马拉松的爱情注定给我俩的感情打下了坚实的基础。妻子
对属性值以模糊数直觉模糊数形式给出的多属性决策问题,提出了一种基于TOP-SIS的模糊数直觉模糊数多属性决策方法,该方法首先定义了两个模糊数直觉模糊数之间的距离,然后给出
由卫生部人事司、卫生部科教司、总后卫生部科训局、健康报社联合举办,由北京四环制药厂协办的这一活动,旨在通过表彰在西藏、新疆、青海、内蒙、云南等12个省、自治区的边远
每个人的生命只有一次,许多人并不懂得如何珍惜生命。他们宁肯在患病之后忍受病苦,却不知道通过预防保持健康。
期刊
采用BP型神经网络对某炼油企业汽油调合数学模型进行研究,依据汽油生产装置特点,确定了神经网络的拓扑结构,利用采集的汽油生产数据,确定了隐含层节点数和模型学习算法,并经过模型
能量平衡表和能源网络图是分析项目能效水平高低的有效工具和方法。针对大型石化项目的用能特点,对能源网络图在石化项目的实际应用进行针对性分析和理论探讨,并籍此对项目能源
父亲前段时间身体欠佳,我利用暑假送小孩回湖南老家的机会,在家里多呆了一些时日。父亲只有初中文化,但思维敏捷,勤奋好学。他曾跟人学了一门篾匠手艺,方圆几十里,技术都是响
中国共产党第十九届中央委员会第一次全体会议公报  (2017年10月25日中国共产党第十九届中央委员会第一次全体会议通过)  中国共产党第十九届中央委员会第一次全体会议,于2017年10月25日在北京举行。  出席全会的有中央委员204人,候补中央委员172人。中央纪律检查委员会委员列席会议。  习近平同志主持会议并在当选中共中央委员会总书記后作了重要讲话。  全会选举了中央政治局委员、中央政治局
介绍了9RSZ-540型秸秆揉碎机的总体配置,对其主要工作部件的结构形式进行了分析和确定,并对其工作参数进行了选择和计算。将揉碎(无筛)室与抛送室合二为一是该机的创新,加工