基于自然计算的软子空间聚类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kangshuangming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的发展,各种各样的可用性高维数据在互联网上爆炸。例如,数以百万计的车站、街道、机场和世界各地的城市的摄像头所产生的图像数据、海量的股票信息、大规模的高维度基因表达数据、商品信息、文档信息等,这对于压缩、存储、聚类和传输大量复杂的高维数据提供了原材料。聚类是数据挖掘的一项关键技术,目的是研究数据间逻辑上或物理上的相互关系,从而揭示数据间的内在联系与区别,以及为进一步的数据分析与知识发现提供重要依据。然而,高维数据的膨胀对经典的聚类算法带来了巨大的挑战,传统聚类算法的缺陷越来越明显。高维数据的稀疏性和冗余性的特点决定了簇只存在于某些低维的子空间中,如k-means等经典方法的欧式距离的相似性度量不再适用,此时再用传统聚类来处理高维数据,结果是很难预测的。如何处理高维数据的聚类,并应用在实际问题中对推动信息时代的发展有着巨大的意义。  本文围绕高维数据的聚类问题展开研究。首先针对高维数据子空间聚类的已有方法进行了学习和概括;然后根据现有子空间聚类方法的不足,主要针对多样性差,局部最优以及高类别聚类问题进行了研究和改进,提出几种基于高维数据的子空间聚类算法。具体的内容及工作安排如下:  (1)为了更好的改进子空间聚类算法的全局搜索能力,且让子空间聚类算法能够提高准确性,避免陷入局部最优,本文提出了一种基于差分进化的软子空间聚类算法,即DESSC算法。该算法结合差分进化优化算法和软子空间聚类算法,将差分进化算法用于优化子空间聚类的权值矩阵,有效地提高了高维数据的聚类准确度。  (2)针对聚类算法的不稳定性和容易陷入局部最优的问题,本文引入了基于量子行为的粒子群优化算法,结合子空间聚类算法,提出了一种基于量子粒子群的软子空间聚类算法( QPSOSC),介绍了量子粒子群算法的原理以及特点,详细阐述了QPSOSC算法思想及其步骤。QPSOSC算法将 QPSO算法用于优化子空间聚类过程中的权值矩阵,有效地提高了权值矩阵的多样性和稳定性。  (3)对于高类别的高维数据且类别数不是很精确的问题,本文引入了多目标的思想,即在软子空间的基础之上,结合了多目标优化的方法 NSGA-Ⅱ,提出了基于NSGA-Ⅱ的软子空间聚类算法(NSGASC),详细介绍了该算法的相关原理,并在高类别高维数据集上进行了算法的对比实验。  本文得到如下基金资助:教育部新世纪优秀人才支持计划:(NCET-12-0920);陕西省科技新星计划:(No.2014KJXX-45);国家自然科学基金:(Nos.61272279,61371201,61272282和61203303)和“111”创新引智计划(No. B07048)。
其他文献
香糯竹(Cephalostachyumpergracile)——唯一一种用于烧制竹筒饭最佳的竹子,是植物系统分类学研究中具有重要学术价值并具有特殊文化内涵的珍稀竹种,由于其自然分布区狭窄,种质
序列对位是最常用的一类生物信息学研究方法。它在序列的功能、结构及进化关系预测、数据库搜索,系统发生树构建等方面有着广泛用途。然而,序列对位所得到的分值本身并不能说明
科技的飞速发展使得生物信息学得到广泛的关注,它的主要研究对象之一是基因组学。随着人类基因组全部序列测序的完成,核苷酸数据库中的序列和碱基数量得到迅猛的增长,因此能
微电子机械系统(MEMS)是一个发展十分迅速、应用日渐广泛的领域,而MEMS传感器是应用最为广泛的MEMS器件,其中的MEMS谐振式传感器具有高灵敏度、高Q值、高稳定性、低噪声性能
氢气传感器早已广泛应用于家庭生活、医疗卫生、能源及环境检测等众多领域。而SnO2作为一种应用最为广泛的气敏材料,一直是作为研究氢气传感器的热点,SnO2材料是一种宽禁带半导
随着集成电路技术的飞速发展,微电子器件的生产对图形转移技术的工艺要求越来越高,纳米压印技术作为一种高分辨率、高产量、低成本的图形转移技术,具有巨大的应用前景。基于假塑性金属流体的纳米压印技术可以用来制备金属银互连线,但压印后得到的银线条结构疏松、且存在大量溶剂,导致其导电性很差,需要后续的热处理工艺使其更加致密,但热处理后银互连线的各向同性收缩会导致作为关键工艺参数的特征线宽受到影响。本文通过在银
学位
以黄粉虫为材料提取壳聚糖,并对常规方法、分步碱液法、微波法、相转移催化几种制备方法进行了比较研究。从产品质量、环保、经济、节省时间缩短生产周期等方面综合考虑,相转移
超抗原(supperantigen SAg)的概念由White 等于1989 年首先提出,它是由一组细菌或病毒编码的蛋白分子可不需要抗原提呈细胞(APC)处理,以完整的蛋白质分子形式直接与APC 膜上
  本文在对广州市海珠区2000年的TM遥感卫星照片进行遥感判读的基础上,结合该区城市湿地生态系统实地的点、线、面调查,进行了系统误差的纠正。海珠区的城市湿地采用比较简洁
人ndrg2 (N-myc downstream regulated gene 2) 基因是第四军医大学生化教研室【11,12】于1999 年从正常成人全脑cDNA 文库中最先发现并克隆得到的。其染色体定位于14q11.2,