快速有效的并行二分K均值算法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:sck1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据所表征的归属类是在数据之间复杂联系的背后隐藏的一种难以被人们发现的模式。目前,已经有很多种聚类分析的方法被用在数据挖掘中来分析这种模式,这些方法各有利弊,有一些算法已经付诸实践。K均值就是其中一种简单易行的算法,但是该算法却存在着很多弊端。K均值算法中需要由用户来确定待聚类的个数K,而且初始的聚类中心也有很大的不确定性,这就导致了该方法具有不稳定性且容易陷入局部最优解,而得不到全局最优解。图像分割是实现视觉理解的基础,但由于图像结构和内容不同,要实现快速通用的图像分割仍然是一个难题。聚类分析可以在图像没有先验知识时进行初步分割。基于聚类分析的图像分割方法对样本空间的约束小,分割算法的通用性好。无论是灰度图像、彩色图像分还是纹理图像,都可以应用聚类分析方法完成分割。但是基于聚类分析的分割方法还不完善,主要因为聚类分析计算量大,存在极值问题和对噪声样本敏感。对上述K均值方法存在的问题进行了研究,利用K均值方法对于数据二分的结果较为稳定的特点,设计并实现了并行二分K均值算法。该算法调用K均值对数据按照细胞分裂的方式进行切分,构建一棵满二叉树,当叶子结点数超过数据的类别数时对叶子结点进行部分合并,进而获得最终的聚类结果在此过程中,并且把并行二分K均值方法应用于图像分割。本文的研究工作主要要包括以下几方面:(1)用并行二分K均值方法与已经有的二分K均值方法进行对比实验,实验证实并行二分K均值相比于二分K均值具有较低的时间复杂度和较好的聚类效果。并行二分K均值方法保留了K均值方法处理大规模数据的优点并且比其时间复杂度更低。通过实验结果表明,并行二分K均值算法具有较高的运行效率,比K均值,二分K均值更适合于处理大规模数据。(2)把并行二分K均值算法用于图像分割领域上,和传统的K均值算法做了对比实验,实验结果表明:在图像分割效果相当的情况下,并行二分K均值算法比K均值算法的处理时间降低了25%。实验证明,本文提出的算法是快速有效的,在获得较好图像分割结果的同时,比一般算法耗时更少。
其他文献
随着通信接收机向着数字化、软件化方向发展,利用软件无线电设计与实现接收机是目前研究的热点和发展的趋势。而目前的ACARS、AIS接收机是先利用模拟方式将基带信号解调出来,
认知无线电通过对授权频带的二次利用,可以有效缓解目前的频谱资源危机。作为认知无线电的一项关键技术,频谱感知通过连续不断地检测信道环境,捕获闲置的频谱空穴加以利用,同时不
随着计算机技术的发展,各种应用软件已经融入到社会生活的各个方面,而软件的规模也越来越大,随之而来的软件性能问题也逐渐引起人们的重视。纵然现在已有众多的软件测试方法
随着无线通信技术的快速发展,用户数量持续增长,频谱资源日趋紧张,系统对数字调制技术的要求越来越高,一般的数字调制技术往往不能满足现代通信的严格要求。连续相位调制(CPM)信号
随着三网合一的逐步推进,EPON作为PON网络的代表,具有带宽高,成本低,结构灵活简单等优点,被认为是最佳的解决方案之一。但是EPON网络结构为点到多点,上行数据共享同一信道,下行数据
波达方向(DOA)估计是信号处理领域的研究热点之一,这一技术应用广泛,在通信、雷达等领域发挥着越来越重要的作用。在过去的几十年里人们不断提出了一系列高效的DOA估计算法。
多用户多输入多输出(Multiple Input Multiple Output, MIMO)系统利用空分多址技术使得多个用户共享同一时频资源,进一步提高了系统的频谱利用率但同时也导致了用户间的干扰。
数字阵列雷达由于采用数字波束形成(DBF)直接控制雷达发射波束,对于复杂环境下弱小的目标检测和高速运动目标的跟踪有很大的优势。本文主要研究数字阵列雷达实验系统中信号处
人脸识别技术是计算机视觉和机器学习领域中一个重要的研究课题,在信息安全、人机交互、图像检索等方面有着广阔的应用前景。人脸识别就是将从静态图像或者视频中检测并提取出
外辐射源MIMO雷达是一种利用空间环境中已经存在的信号源在多发多收的天线组合下对目标进行检测、估计或者分类的新体制雷达,它既具备了外辐射源雷达的优点,又兼顾了MIMO雷达