一种改进的密度峰值聚类算法及其应用研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:yl9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
密度峰值聚类算法(Clustering by fast search and finding of density peaks algorithm,简称为DPC)是2014年发表于Science杂志上的一种新型聚类算法,该算法与传统算法相比,具有参数少,聚类过程无需迭代,可以发现任意形状的簇等多个优点,该算法为近年来聚类算法的一个研究热点,并被广泛应用于各种领域。尽管DPC算法在大多数数据集上可以表现出良好的聚类效果,但是该算法仍然存在不足之处:(1)该算法需要人工干预进行中心点的选择,导致聚类结果具有主观性;(2)该算法默认一个簇内只有一个中心点,对于存在多个中心点的簇容易进行误分。为了解决DPC算法存在的问题,本文结合线性拟合方法,提出了一种改进的线性密度峰值聚类算法(Linear fitting Density Peaks Clustering algorithm,简称为LDPC),该算法进行了两方面的改进:(1)LDPC采用线性拟合的方式自动进行类簇中心的确定;(2)LDPC根据同簇中数据点密度直达的原则对同一簇中多个中心点进行合并。LDPC算法的核心思想为自动进行类簇中心的确定,为了验证LDPC算法的有效性,本文采用经典的K-Means算法验证LDPC算法是否可以自动并准确地确定类簇中心,使用LDPC算法对K-Means进行初始化,本文将使用LDPC初始化的K-Means改进算法命名为LDKM算法(Linear fitting Density Peaks K-Means algorithm)。算法结果表明LDPC可以准确地确定类簇中心,即算法验证了LDPC的有效性。本文采用五个人工数据集以及三个UCI数据集对LDPC以及LDKM算法进行实验,验证了算法的有效性,并与K-Means、FCM、DBSCAN、DPC算法进行对比,实验表明LDPC算法在大部分数据集上表现最优,评估指标优于其他算法。LDPC相对于传统算法而言,适用的数据类型更加广泛,可以处理任意形状的数据集;相对于DPC算法而言,无需人工干预运行过程,并且实验结果更优。LDKM算法在实验数据集上的评估指标值均优于传统的K-Means算法,LDKM相对于传统的K-Means算法而言,无需传入参数,并且聚类效果更佳,表明使用LDPC进行K-Means算法的改进效果良好。最后,本文将LDPC和LDKM算法应用于图像分割领域,与其他算法相比,实验结果轮廓清晰,并且噪音少。最后将LDPC算法应用于白细胞的分类识别,对血细胞图像进行背景噪音消除,只保留白细胞,方便后续处理,实验表明,LDPC算法可以完整提取出白细胞,提取结果纯净。
其他文献
<正>2015年,石嘴山市就业创业工作紧紧围绕市委九届五次全会提出的推进"三大转型"目标任务,以深化改革为动力,以依法行政为保障,以稳中求进为基调,积极落实就业创业政策,主动
<正>石嘴山市成立于1960年,地处宁夏北部,辖大武口区、惠农区和平罗县,总面积5310平方公里,总人口74.5万,城镇人口比例为59.6%,回族人口占20.8%。全市城乡劳动力37
在国际工程项目管理的各个阶段中,风险的管理应贯彻始终. 风险首先是一种不确定性,其次它与损失密切相关,所以从本质上讲,工程风险就是指的在工程建设中所发生损失的不确定性
量子纠缠是一种切实的物理资源,量子态的纠缠特性是量子力学区别于经典力学的最基本特征,对量子纠缠的研究具有重大的科学意义.本文主要研究多光子纠缠态的制备和多量子比特
宁夏作为全国第二个创建全域旅游示范(省)区,旅游发展目前进入了快车道。中卫市海原县李俊乡旅游资源丰富,在全域旅游发展中,坚持社区参与实现精准扶贫、全民参与和共享理念等
防治和修复土壤有机污染、保护土壤环境安全、以实现土壤资源的可持续利用是当前全球关注的一个焦点。研究有机污染物在土壤中的吸附-解吸过程及作用原理,搞清土壤组分与有机
第二十五节 完善就业服务体系$$坚持就业优先,实施更加积极的就业政策,创造更多就业岗位,着力解决就业结构性矛盾。培育发展吸纳就业能力强的产业,以产业带就业,以就业促产业,实现
报纸
自2015年《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》(下文简称《民间借贷司法解释》)颁布以来,虽然缓解了该解释实施之前的各地方法院因法官自由裁量权过大而导致的关于借贷案件裁判不一、司法混乱局面。但是在审理单一证据下的民间借贷纠纷案件时,借款人通常只能提供借条等债权凭证或者转账凭证等金融机构凭证,而无其他相应证据,各地方法院若无法合理分配原被告双方的证明责任,就会产生不公正的判决。
墓碑作为中国古代文物的一种载体,不仅记载了人物的生平,同时也反映了当时的政治文化经济,对历史的考据有重要的作用。墓碑在魏晋时期便已经存在,到隋唐时期发展最为鼎盛。随着时间的流逝,许多具有重要历史意义的墓碑表面遭受到不同程度的损坏。许多墓志数字化拓片质量不高,表面文字断裂,且有大量斑块(噪声)。因此,本文以墓志数字化拓片的复原方法为研究课题,以期通过自身研究改善数字化拓片质量。隋唐时期的墓碑发展较快
合成孔径聚焦成像是一种通过逐点聚焦的方法将小孔径成像合成大孔径成像,能够使图像的分辨率不随位置和深度变化的超声后处理方法。而超声Fourier成像作为一种新的成像方式,