基于秩约束的自适应聚类方法

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:bb314949909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析技术能够辨识数据的内在结构,随着计算机技术的发展,聚类技术的应用也越来越广泛,无论是学校、商场、研究中心还是政府办公等一系列的领域都出现了聚类技术的身影。因此,近年来聚类技术已经成为学术界的一个着重研究的内容,得到了学者的关注。本文介绍了数据挖掘技术和聚类分析技术的背景和现状,对常见的相似性测量方法和经典的聚类方法进行总结,分析出它们的优缺点,本文对数据挖掘技术和聚类分析技术中相似度矩阵和聚类划分方面进行深入研究,本文研究工作的主要内容如下:第一、聚类基于数据的相似矩阵划分数据组,因此聚类结果的优劣高度依赖于数据相似矩阵的好坏,构建相似矩阵的方法有许多,其中用的比较多的构造法使用欧式距离测量,很多情况下单纯把欧式距离测量对象之间的距离作为衡量对象之间相似度的标准往往会造成测量结果出现很大的误差,也就使最后的聚类结果并不理想。本文提出一种基于密度敏感距离构造相似矩阵的测量方法,该方法具有扩大不同簇对象之间的长减小同簇对象的长的作用,并且能够提高聚类的准确率。第二、如果要把一个含有n个样本的数据集划分为k类会有nk种可能,聚类作为一种无监督的学习算法,如何使聚类划分出的结果更优,或用什么方法能够使聚类结果更准确是聚类研究人员一直关注的,本文提出了一种在相似矩阵的拉普拉斯矩阵上施加秩约束的方法,该方法使相似矩阵的连通区域数等于聚类数,直接将样本点分到正确的类中,进而完成数据集的聚类任务,实验证明这种方法可行且在一定程度上提高了聚类性能。每一种聚类算法都融入了研究者的心血,在某种程度上改进已有的聚类算法的一些不足,很多聚类算法虽然已经被广泛的应用,但依然存在一些不足,所以,探索更高性能的聚类算法一直是研究者的目标。
其他文献
科学技术推动世界的发展,科技的力量正影响着我们生活、学习和工作。矿产资源管理信息化作为矿产资源管理工作与现代信息技术的结合点,对促进高效管理、科学决策、依法行政,进
基于特征造型技术的三维CAD系统目前已广泛应用于产品设计。随着三维建模技术的发展,CAD系统中包含越来越多的几何特征。含有丰富特征的CAD模型被广泛应用于产品发展的各个阶
cDNA微阵列和寡核苷酸芯片等高通量检测技术的成熟应用,产生了大量的基因表达数据,其中包括静态数据和时序数据。基因表达时序数据反映了生物基因在时间进程上的特性,对其进
随着并行与分布式系统的发展,并行计算机中处理器数量大量增加,处理器之间的互连网络的性质显得越来越重要。同时,在具有大量处理器的系统中,处理器发生故障的情形变得不可避
从数据挖掘的角度上看,分类问题就是要建立相应的分类模型或者分类规则,使用构建好的分类模型将未知分类的样本映射到某一个类中。贝叶斯分类法以其坚实的理论基础和良好的分类
多处理器系统是并行计算系统的一种实现方式,具有良好的可扩展性、高可靠性和高性价比等优点,因而得到了广泛的应用。但是多处理器系统的处理单元独立性强,并且系统结构松散,
随着计算机应用技术的迅速普及,各个领域的业务数据量以前所未有的速度快速增长,数以TB的数据积累存储在各自系统的数据库中,使得提取其中的信息变得越来越困难。数据挖掘技术自
由于无线接入系统高带宽,灵活的移动性和QoS的要求,无线宽带接入技术近几年来受到越来越多的关注。其中基于IEEE 802.16标准的WiMAX技术被认为是未来最受注目的一项技术。WiM
算法是对问题求解过程的精确描述,它不仅是计算机科学的一个分支,更是计算机科学的核心,可以毫不夸张地说,它同大多数科学、商业和技术都是密切相关的。算法设计是一项创造性
放射治疗的根本目标是最大限度地杀灭肿瘤细胞并使周围的正常组织和重要器官免受和尽可能少受不必要的照射。调强放射治疗(Intensity Modulated Radiation Therapy,IMRT)被放