基于局部信息的聚类新算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhang1xiao123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,人们对知识获取及信息处理的需求进一步升级,数据挖掘技术应运而生。聚类分析作为其中最关键的算法之一,以相似度为基础,主要用于识别对象间内在的联系、发现数据集中未知的类。聚类理论及方法的深入研究,对相关算法的性能和适用场景提出了更高的要求,由于已有算法在计算相似度时往往会将一个样本与除自身之外的所有样本进行比较,导致计算量过大且计算时间也难以接受,造成了算法对于较大规模数据集的可伸缩性较差。因此如何合理恰当地利用局部信息,是改善聚类算法性能的关键。本文在深入研究多种经典聚类算法的基础上,对其中存在的缺陷进行分析,结合所学知识提出了相应的改进算法,具体的工作包括以下两方面:(1)针对数据集聚类中心的识别问题,提出了一种基于改进引力搜索的聚类中心识别算法。为了将识别聚类中心的目标与引力搜索算法相结合,本章设计了一种新的编码方式,使得一个粒子可以表示一组聚类中心点,粒子迭代的过程就是聚类中心点不断优化的过程;为了更准确地识别聚类中心,本章改进了引力搜索框架:首先重新定义种群适应度函数;然后算法在每轮迭代的末尾新增了局部搜索操作,用于增加种群多样性且避免了该框架本身易早熟的缺陷。根据改良后的引力搜索框架,最终提出了本文算法。为了检验所提算法是否有效,将其与另外两种经典迭代算法及三种近年来提出的新算法做了对比试验。结果表明:本章提出的方法在测试样本集上均得到了较好的结果,聚类准确性得到了显著提升。(2)针对密度峰值算法密度定义及样本分配策略存在的问题,设计了一种基于数据场的改进密度峰值聚类算法。该算法由两个阶段构成:第一阶段是获取聚类中心,首先基于数据场与最小势熵优化得出邻域半径,然后利用改进的势能公式计算各数据对象的势能作为密度,并依据相应公式计算距离,根据密度和距离构造新的决策图以确定聚类中心。第二阶段执行样本分配策略,算法将所有样本按照一定规则分为中心点、核心点及疑似离群点三类,分别为这三类样本设计了不同的样本分配策略,克服了原密度峰值聚类算法的“连带分配错误”。在人造数据集和UCI数据集上的结果证实了所提算法能准确的识别类中心,且克服了原始算法样本分配策略的弊端,聚类正确性得以提高。
其他文献
国内外众多科研人员主要基于拉伸、压缩、弯曲及间接拉伸等室内疲劳试验,对沥青混合料的疲劳性能进行了深入的研究,由于室内疲劳试验的受力模式、试件形状及尺寸不一,疲劳试
在光学三维测量技术中,相位辅助三维光学测量技术具有实现简单、精度高、分辨率高、测量时间短、非接触等的优点,一直以来都是国内外研究的热门课题,已经受到了极大的关注并
近年来我国自然灾害的发生频繁,尤其是洪涝灾害近年频发,对社会、经济造成的影响巨大。我国的国土面积大,灾害发生后救援物资能否安全、及时地配送到受灾地,是保证受灾群众生活、维持社会稳定的重点。但灾害发生后往往会发生道路通行能力变差甚至造成道路无法通行的情况,有时还会伴有次生灾害的发生,对配送应急物资、车辆、人员的安全造成影响。快速决策选出合理的应急物资车辆配送方案,保证路线的快速、安全、合理,使物资快
本文采用水热法在生长ZnO种子层的FTO导电玻璃上制备了一维有序的ZnO纳米棒阵列;然后采用浸泡提拉煅烧法将ZnO纳米颗粒包覆于ZnO纳米棒上形成新的ZnO种子层,通过二次水热生长
随着近几年环境问题和社会问题的日益突出,可持续发展的观点逐渐深入人心,透明时代的到来要求企业及时准确地向利益相关方披露履行社会责任的信息。而水电行业作为国家重要的能源基础行业,是国计民生的基础。企业的利益相关者对于水电行业披露社会责任信息的需求更加强烈。但是目前我国水电行业的社会责任会计信息披露质量不高,因此通过对水电行业社会责任会计信息披露现状的研究并找出其所在的问题以及背后的成因,进而拟定具有
基于三维骨骼的人体行为识别一直是计算机视觉领域的研究热点,其目标是自动分割、捕捉和识别人体行为,自上世纪60年代开始受到学者们的广泛研究,它已被用于视频监控、保健医
非化学计量比的过渡金属氧化物由于具有大量氧空位从而表现出强烈的局域表面等离子体共振效应,使其在光催化、电致变色等领域得到广泛研究。本论文通过溶剂热法成功制备具有
随着量子计算机技术的迅猛发展,基于离散对数和因式分解等数论难题的密码体制已经被证实不能抵抗量子计算攻击。然而,基于纠错码的公钥密码体制具有抗量子计算攻击的特性且其
随着大规模标注数据的出现及深度学习技术的快速发展,自动人脸识别技术已经获得了重大的突破并取得了超越人类的性能。目前,该技术已经广泛的应用于安防、金融、监控、布控等
近年来,我国政府加大改革开放力度,在全面深化各领域改革、推进国企国资改革的大背景下,水电企业的运营受到竞争日益激烈的挑战。在国际市场中,全球经济增长趋势放缓,水电企业开展对外投资,容易受到政治、经济、文化、重大自然灾害等影响而达不到预期效果。传统的成本管理已经适应不了水电企业可持续发展的需要,水电企业加强成本控制显得紧迫而重要。本文借鉴已有的成本控制理论,结合S水电公司的实习经历,通过调研走访,将