一种改进的适用于混合型数据的快速聚类算法

来源 :兰州大学 | 被引量 : 0次 | 上传用户:linshenxiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Rodriguez和Laio在2014年提出的快速聚类算法(RL算法),由于可以识别任意形状的类簇,且不需设定最终聚类的个数k,而被广泛应用。因为混合型数据集样本点之间的距离计算较为复杂,每个样本点密度的定义较为困难,所以很少有研究者把快速聚类算法运用到混合型数据集上,但实际生活中的大部分数据都是混合型的,于是我们提出一种改进的适用于混合型数据的快速聚类算法(算法2),这个方法是基于RL算法改进的,适用于混合型的数据集。算法2首先定义了混合型数据集的距离度量,然后用类中心自动选择算法(算法1)选择出可能的类中心,接着将剩余点一一归到比之密度更高离得最近的那个点所属的类,最后进行类合并同时输出最终结果。当数据量很大,距离计算的复杂度和时间会以平方的速度增加,为达到缩减计算复杂度和时间的目的,文章用算法2结合滑动窗口模型的方法进行大样本混合型数据的聚类。最后用UCI里的几组数据集来验证算法的有效性。
其他文献
在实际岩土工程应用中,在循环往复荷载,地下水位的波动或超压预载地基处理的作用下,浅层土壤往往是处于超固结状态的。同时在软土地基上建造边坡、挡土墙等时,在受到循环荷载作用之前,软土地基已经承受了边坡、挡土墙等的静荷载作用,即土体单元在水平面上已经承受了初始剪应力。在循环荷载与初始剪应力的共同作用下,地基土会有明显的应变、孔压累积,从而导致土体的刚度和强度的退化,地基土体结构破坏。针对以上问题,本文以
本文以超声协同酸解1、3、5、7天豌豆淀粉为原材料,研究了酸解淀粉颗粒制备荧光材料的方法和荧光材料应用时最佳条件。应用光谱性质,荧光量子产率、扫描电镜(SEM)、透射电镜(
CA6NM钢是一种美国铸造马氏体不锈钢,中文牌号为0Cr13Ni4Mo,由于这种钢有良好的耐腐蚀性、耐气蚀性等性能,因而在核电领域得到广泛应用。在核电材料的使用过程中,疲劳断裂是
图像拼接技术是将多张具有重叠区域的图像叠加,进而形成大视角、高分辨率图像的过程。近年来,图像拼接技术有了较快的发展和广泛的应用。本文提出了一种结合曲波变换和最优拼
本文通过进行拉伸实验、低周疲劳实验、蠕变实验、显微组织分析、X射线衍射分析以及扫描电镜和透射电镜观察,研究了Ti元素对T6态挤压变形Al-5.5Cu-0.9Mg-0.2Sc-0.15Zr合金的
为建立设置支撑的一般线性粘弹性阻尼器耗能隔震结构基于反应谱的抗震分析与设计方法,对耗能隔震结构系统非平稳随机地震响应和线性粘弹性阻尼器在任意激励和非零初始条件下
合成具有新颖结构,性能优异的配位聚合物已经成为了现代配位化学和晶体工程的研究热点。本文以构筑能够进一步发生固相光化学反应的配位聚合物为目标,以过渡金属Ag(I)/Cd(II)/Zn(I
在过去的接近20年里,镧系金属所构筑的多核配合物因为其自身特有的结构特点、光学性质和磁学性质而受到了广泛的关注和研究,取得了较大的实验方面和理论知识的研究进展。在这
无线通信广泛影响着人们的日常生活和社会经济发展。第五代移动通信将迎来流量的上千倍增长、连接设备数量的爆炸式增长以及不断涌现的新业务与新应用。其中,提高网络吞吐,降
由于绝对矩块截断编码(Absolute Moment Block Truncation Coding,AMBTC)编解码速度快、计算复杂度低和压缩率较高等特性被广泛应用于数字压缩图像的互联网实时传输。因此,以AMBTC图像为载体的信息隐藏(Data Hiding,DH)技术日益受到人们广泛的关注与研究。然而,数字图像作为载体的信息隐藏相关算法应用到AMBTC图像时存在图像质量低、嵌入容量较少和安全