自适应密度峰值聚类算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:zwsbjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
密度峰值聚类算法(DPC)是一种新的基于密度的聚类算法,该算法具有原理简单、高效快速等优点,自从提出以来便引发许多学者的关注,且被广泛应用于图像处理、生物医学、文档处理等领域。同时,人们在应用中也发现DPC算法存在着一些问题:(1)该算法的聚类结果在一定程度上受截断距离参数设置的影响,人为设定的参数值将无法避免主观性与随机性这一问题;(2)样本局部密度的计算方法仅考虑了距离因素,而未能充分考虑全局的分布情况;(3)在决策图生成后需要手动选取聚类中心,对于某些数据集而言,可能会导致聚类中心多选或漏选的情况,这会直接影响聚类结果。本文针对密度峰值聚类算法存在的不足之处进行了深入研究,并在此基础上进行了优化改进,具体研究内容和研究结果如下:1.提出了一种结合鲸鱼优化算法的自适应密度峰值聚类算法(WOA-DPC)。首先,利用局部密度和相对距离乘积的加权值设计了一种自动选取聚类中心的方法,避免了手动选取导致的聚类中心少选或多选的情况;其次,考虑到合理的截断距离dc是提高DPC算法聚类效果的重要因素,建立以ACC指标为目标函数的优化问题,利用鲸鱼优化算法(WOA)有效的寻优能力对目标函数进行优化,寻找出最佳的截断距离dc。最后,在人工合成数据集与真实数据集上对WOA-DPC算法进行了聚类测试,结果表明,WOA-DPC算法得到的三个聚类指标值均优于其他对比算法,在大多数数据集上都有较好的聚类表现。2.提出了一种基于加权共享近邻与累加序列的密度峰值聚类算法(DPC-WSNN)。首先,基于加权共享近邻重新定义了局部密度公式,不仅避免了截断距离dc选取不当对聚类效果的影响,而且能够有效处理不同类簇数据集分布不均的情况;其次,在原有决策值γ的基础上,生成一组γ的累加序列,将累加序列的均值作为聚类中心和非聚类中心的临界点来实现聚类中心的自动选取。最后,在16个数据集上对DPC-WSNN算法进行聚类测试,结果表明,相较于其他对比算法,DPC-WSNN算法具有更好的聚类效果。
其他文献
一直以来,印刷品作为常见信息交流工具,广泛地应用于生产生活。但其极易被不法分子复制甚至篡改,对社会的知识产权安全和生产创新带来了极大的破坏。传统的数字水印技术是保护信息安全的一大措施,但应用范围有限,无法有效应对打印扫描攻击,同时还有透明性、嵌入容量较低的缺陷。如何开发出能够抵抗打印扫描攻击的水印算法成为社会研究热点。目前,变换域算法能够有效的解决这一现状,其中DWT变换后的LL分量具有较好的鲁棒
随着新一代信息技术的创新发展,袜业制造行业从传统的手工生产逐步向数字化、智能化和柔性化的方向转型,但在袜品反求生产领域尚处在传统的人工打样阶段。本文结合袜子制版文件特征与图像特征提取技术的发展现状,将三维立体袜品转换为正反面拼接的数字图像,对样板袜品进行图像采集、袜子制版文件反求、袜子制版文件二次设计等功能设计,研发一种数字化、自动化的袜子制版文件反求生成系统。本文的主要研究内容如下:(1)基于颜
随着我国移动端、互联网技术的飞速发展,屏幕内容图像(Screen content image,SCI)的主成数量越来越多。然而,在对SCI进行获取、传输和压缩等过程中易产生噪声干扰和图像失真,这种干扰和失真造成的图像质量下降难以被精准评估和预测。基于自然图像的评估SCI的视觉质量预测中不能起到有效作用,已成为制约SCI评估指标提高的关键问题。因此,对客观的屏幕内容图像质量评估方法进行高效分析和建立
图像显著物体检测的目的是识别出图像中最重要的物体区域,并将目标区域从背景中剥离出来。由于图像中的显著物体容易受到背景区域的干扰,使得图像显著物体检测非常具有挑战性,为了提高图像显著物体检测的性能,本文对图像显著物体检测算法进行了研究,提出两种图像显著物体检测算法。一种是基于特征增强与融合的显著物体检测方法。该方法首先利用卷积神经网络提取RGB图像的不同卷积层的特征,然后使用图像的高层特征信息指导低
条码作为一种快速识读技术,已经广泛地应用在商品结算、物流运输、仓库管理等领域。常见的有一维条码和二维条码,二维条码广泛地应用在移动支付、电子商务、产品追溯等领域,目前市场上应用的是黑白二维条码,本文将研究如何在黑白二维条码中添加颜色信息,来提高信息存储容量和安全性。本文以目前市场上应用最广泛的QR码为研究对象,为了增大信息容量,将彩色信息附加到QR码点阵图上来传递附加信息,QR码点阵图传递的信息称
随着数字技术的迅猛发展,以及各种强大的图像处理工具的广泛使用,非专业人士可以在不留下任何可见线索的情况下对数字图像进行美化、编辑、甚至修改和伪造,这将破坏图像内容的原始性、完整性和真实性。同时,虚假图像的存在和传播降低了数字内容的可信度,在科学研究、新闻传媒、司法取证、金融和军事等诸多领域造成了严重的负面影响。因此,迫切需要开发功能强大的图像篡改检测工具/算法来识别图像内容的篡改,保证图像内容的原
随着信息化时代的不断进步,二维码由于信息承载量大、编码类型众多、可加密、成本低、易制作等优点应运而生,日渐渗透于人们的衣、食、住、行各个方面。然而,传统黑白二维码逐渐地暴露出自身的不足:一方面,由于二维码是一种由黑白模块构成的矩形码,外观无法满足人们对视觉交互的要求,因此迫切需要对其美术表现形式进行视觉改进;另一方面,传统二维码无法对存储信息进行预读,容易造成误扫。因此,如何优化传统二维码的视觉体
高分辨率图像能够提供较丰富的空间结构信息,是彩色和光谱成像设备的重要发展方向。然而,受成像设备的硬件限制、噪声及传输过程中的压缩等因素影响,采集得到的图像分辨率通常不够理想,易导致所成像场景目标的部分关键信息丢失。因此,在以上成像条件限制下,提升图像的分辨率,即图像超分辨率重建技术,对信息的挖掘和利用具有重要意义。近年来,图像超分辨率已经被广泛应用于监控识别、无人驾驶和医学成像等技术领域,并且已经
图像分割和目标检测一直是图像分析与计算机视觉领域的重点研究课题。随着近几十年来复杂网络理论的快速发展,将复杂网络理论应用到图像分析与计算机视觉领域成为研究人员关注的问题之一。本文以复杂网络理论中的社团检测和节点度分布理论为中心,对图像网络的构建、图像分割和视频中运动目标检测算法进行了研究。具体研究内容如下。(1)提出了一种基于局部网络模块度增量的超像素分割算法(LocalNet)。以像素点颜色相似
数字视频是多媒体技术的一个重要传播途径,被广泛应用于社会的各行各业之中。如何让用户能够快速捕捉到视频的内容,从而决定是否需要继续观看是需要关注的问题。在这样的背景下,视频摘要技术应运产生。视频摘要是一种新的基于内容的视频压缩技术,它能有效地从视频中发现重要信息,消除冗余数据,是对视频内容的概括。近年来视频摘要技术有了很大的发展,但是如何生成高效、准确率高的视频摘要仍然在不断的探索中,本文围绕视频摘