基于竞争思想的分级聚类算法

来源 :信息与控制 | 被引量 : 0次 | 上传用户:study_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决海量数据分析中的非凸状等复杂聚类问题,同时兼顾聚类算法运算速度,提出了一种新的基于竞争思想的快速分级聚类算法.首先,根据给定邻域半径对数据进行第1级分类;然后,在第1级聚类的基础上,基于数据竞争的思想,以簇间数据密度为依据,设立第1级聚类生成的小簇之间小簇联系性权重的增加准则;最后,依据该准则计算有联系的小簇之间联系权重,对达到权重阈值的小簇进行合并,从而解决非凸状等复杂聚类问题.仿真实验表明,算法的聚类精度和抗噪声能力均优于传统的K-means算法和基于密度的DBSCAN(density-based spatial clustering of applications with noise)算法.由于算法复杂度较低,算法对于大数据的聚类分析将会具有更好的适用性.“,”We propose a new hierarchical clustering algorithm based on competition theory to solve the issue of non-convex and other complex clustering for massive data analysis with efficient computation. First, we separate the data into a number of sub-clusters according to a given rudimentary clustering radius. Then, on the basis of the first-level clustering, we establish a criterion for strengthening the inter-cluster association weight based on the idea of data competition depending on the data density between the sub-clusters. Finally, the sub-clus-ters with qualified association weights are grouped into resultant clusters to solve complex clustering problems, such as non-convex clustering. The clustering accuracy and anti-noise capability of the new hierarchical clus-tering algorithm are superior to those of the traditional K-means algorithm and density-based DBSCAN cluste-ring algorithms. Given the low complexity of the algorithm, the proposed algorithm can be used in clustering analysis of big data.
其他文献
2003年上半年,由于“非典”的原因给国家和CNAL认可工作带来了一定的影响,在社会各界的支持下,CNAL作出了快速反应,围绕着一手抓“非典”防治,一手抓工作的原则,及时调整了工
本文提出一种由交互式多模型和扩展卡尔曼滤波两种算法相结合而形成的滤波器,并应用于锂离子电池非线性系统的状态估计.先采用两个不同参数的戴维宁电路模型描述锂离子电池的
行人再识别指的是在无重叠的多摄像机监控视频中,匹配不同摄像机中的行人目标.本文提出了一种基于核学习的测度学习的行人再识别方法,首先融合行人图像的颜色特征和纹理特征,并使用WPCA(PCA whitening)去除融合后的特征的冗余度,然后将处理过的特征通过核函数映射到更容易区分的核空间,并在核空间训练行人特征对之间的距离测度矩阵和相似度测度矩阵,结合距离测度函数和相似度测度函数来描述行人对之间的相
综合运用钻井、录井、地球物理测井、试采油及各类分析化验数据 ,对辽河断陷盆地西部凹陷南部地区深层沙河街组二段的扇三角洲砂岩及沙三段湖底扇砂砾岩储层特征进行了系统分
以辽河断陷盆地大民屯凹陷中段潜山为实验区 ,在地质研究和全三维构造精细解释的基础上 ,把三维可视化、地震相干体、地震多属性处理与解释、测井约束反演、测井特征曲线反演
由于多速率系统慢采样输出通道的周期与基准周期不同步使得模型预测控制算法不适用.针对此类问题,提出一种适用于多速率系统的模型辨识及模型预测控制策略.首先,针对稳态时间
三年前网络存储领域的一场争论,使业外人士都开始熟悉NAS和SAN这两个术语.但对多数人来说,除了知道NAS和SAN是网络存储的两种曾经相互竞争的技术之外,对二者的特点和与自身企
期刊
为推动信息化战略,中国农业银行制定了,并在今年年初的工作会议上,将“科技创新”列为振兴农行的战略性工程.日前,记者就农行的信息化建设采访了其科技部总经理曹谷崖.
期刊