基于近邻的聚类算法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:penghong97
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类作为一种无监督学习方法已广泛的应用于模式识别、人工智能、数据挖掘、图像处理、生物医学等学科。简单来说,聚类就是依据某种准则将样本点划分为不同的类别,使同一类的样本点彼此相似而不同类的样本点彼此相异。至今,依据不同的准则已提出了众多的聚类算法,虽然这些算法在一定程度上可以对数据进行划分,但仍然存在一些问题。其中需预先确定类别中心、无法准确地发现不同分布形状的数据集以及无法处理类边缘重叠的数据集是聚类算法存在的主要问题。针对这些问题,本论文利用数据集中样本和其近邻的关系,对基于近邻的聚类算法展开了研究,主要研究成果如下:  (1)通过对数据集中样本与其近邻间关系的研究,提出了一种基于最远邻相异性而最近邻一致性准则的最远最近得分评价指标。并以此指标为基础,提出了基于最远最近得分指标的聚类算法,实现了自动确定数据集类别中心和类别数的聚类过程。仿真实验验证了所提算法的有效性以及可行性。同时,将该算法应用于图像分割问题,其结果充分证明了该算法在图像自动分割问题中的实效性。  (2)为了克服已有聚类算法处理不同分布、类别边缘重叠等方面呈现的较差的性能,提出了一种基于连通区域生成的聚类算法,该算法是一种基于样本与其近邻间连通关系的聚类算法。在该算法中,首先提出了一种区域生成算法(CRG)获得连通区域及离散点集,不同的连通区域则对应于不同的类别。然后,依据区域扩张方法和一致性准则来将剩余的离散点进行归类,得到最终的聚类结果。实验结果充分证明了所提算法的有效性和可行性。  (3)基于样本的近邻和逆近邻间的关系,提出了一种子区域渐并自动聚类算法,实现了对类别数和类别的自动划分。在该算法中,首先根据样本的密集度定义了样本的密集属性并挑选出密集点。然后,将密集点划分成众多子区域并依据区域间的相似度进行合并。最后,利用边缘延伸方法和集合归属度将非密集点划分到相应的区域中,得到聚类结果。实验结果,证明了该算法的有效性。
其他文献
红外偏振与红外光强图像的融合作为热红外目标跟踪与识别的前端关键技术,在军用和民用领域都有着广泛应用。当前,两者的融合算法多为事先确定的,而实际应用中两者的差异特征是动
数字化的语音传送、控制和识别是信息社会的基本组成部分之一。但是语音信号在获取和传送途中,都会不可避免的受到各类噪声的干扰,不仅导致接收者听到的语音质量下降,还会影
物联网最近两年在我国迅猛发展,无线传感器网络被形象的比喻成物联网的神经末梢,作为物联网的主要技术之一也得到了迅猛发展,我国也把这项技术列入了长期科技发展规划中。能量问
随着汽车工业的发展,停车场建设的复杂化、规模化带了寻车难的问题,如何快速的找到汽车成为汽车用户和停车场管理人员关注的焦点。受到停车场环境特殊,多样化的影响,传统的室外定
图像配准技术是计算机视觉的一项基础任务,其应用领域包括医学图形处理,遥感图像处理,图像融合,图像搜索,机器视觉,虚拟现实,目标识别,环境监测,图像拼接,安全监控以及地理信
作为近年来飞速发展的社交网络应用,微博已成为人们日常生活中进行交流和信息获取的重要途径之一。微博的内容包含了用户的兴趣偏好信息,这些隐含在微博当中的用户偏好信息对用
随着网络通信的开放和多媒体处理技术的飞速发展,音频信号在传输过程容易遭受到非法的攻击。语音作为一种最为常见的音频形式,在日常通信、法庭取证、指令密保等方面应用广泛
世纪90 年代中期人们提出一种新的天基雷达体制,利用多颗小卫星(或微卫星)编队飞行以实现对地阵列(或称为星座)立体观测。 小卫星具有重量轻、体积小,研制周期短、成本低,发射灵
随着卫星导航系统的广泛应用,对其工作精度及抗打击能力的要求也日益提升,仅仅依靠地面站来维持其正常运行的方式已经无法保障导航系统的自主运行。因此,通过星间测量、星间通信
人体运动捕捉数据能够精准地驱动虚拟人的运动,从而使虚拟角色达到真实流畅的运动效果,它已经广泛应用在了电视电影,三维游戏,虚拟现实等领域。随着当今人体运动捕捉数据的海