群体聚类算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:baijiankai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一种典型的无监督学习问题。与有监督学习相比,聚类分析适用于在没有足够的先验知识的问题,分析研究对象间的相似性模式,从而将无标记的物理对象或者抽象对象划分为若干个组,划分得到的组称为簇。为了能将对象划分到正确的簇中,算法需要挖掘出对象间的相似性。群体智能是一类常用的优化技术,是求解聚类问题的方法之一。基于群体智能的聚类方法常选择一种基于种群的随机搜索算法作为其框架,将种群中的个体编码为一个或一组簇中心向量。随着种群的迭代进化,个体可以同时搜索解空间的不同区域,由此可以找到全局最优解。目前,现有的大多数基于群体智能的聚类算法旨在找到一组簇中心。然而,这种基于中心的聚类方法难以处理具有不规则形状的簇。同时,现有的方法中还存在一些不足,比如难以确定种群的规模和如何初始化种群等。本文使用基于群体智能的方法来解决聚类问题。本文的主要内容包括以下两个方面。(1)提出了群体聚类算法SCA。在SCA算法中,每个数据样本编码为种群中的个体。因此,种群的规模与数据集的规模保持一致;采用核密度估计作为适应度函数来评估粒子的密度;为粒子选择leader粒子来协助粒子飞行,从而降低算法的误差;采用动态的惯性权重调整策略。在常用的人工数据集上对SCA算法进行测试并与其他基准算法比较,实验结果表明SCA算法是一个有竞争力的算法。(2)提出了高效的群体聚类算法SCA2。与SCA算法相比,SCA2算法主要进行了以下改进:1)使用径向基函数网络作为代理模型来近似问题空间的密度分布,从而使用训练好的径向基函数网络作为适应度函数,减少算法的时间开销。此外,SCA2算法使用了合并策略,将飞行过程中符合归并条件的多个粒子合并为一个粒子飞行,从而进一步减少算法的时间开销;2)扩展leader粒子为K-leader列表,使得粒子有机会选择不同leader粒子,从而减少初始的误分配,提高算法的性能;3)使用了简化的位置更新策略,使算法能更好地响应不同密度差之间的差异从而分别处理。实验选择常用的人工数据集和真实数据集来测试SCA2算法的性能,并与其他不同类型的聚类算法进行比较,实验结果表明SCA2算法在大多数的测试数据集中取得较好的结果,是一个更具优势的算法。本文工作不仅对基于群体智能和演化算法的聚类方法研究具有推动作用,而且对群体智能模型和算法的深入研究和进一步发展具有参考价值。
其他文献
党的十九大报告明确指出,要全面建立具有中国特色的基本医疗卫生制度、医疗保障制度以及医疗卫生服务体系。我国的改革开放已历经40年,我国的医改也经历了40年,这期间新闻媒
随着人工智能的迅速发展,深度学习方法在图像中的应用也是越来越成熟。图像分类是图像处理技术中基础且重要的一项技术,目前也出现了很多高精度的分类算法。然而当面对恶劣天气比如雨、雪、雾时,于室外视觉系统中所获得的图像的质量会有一定的影响。本文针对雨天条件下拍摄的图像,利用卷积神经网络进行图像分类,并将计算机识别出的雨天图像应用现今成熟的带雨图像修复算法进行修复。论文的主要工作包括:利用Python爬取雨
Dan Choffnes 博士 201 5 年由哥伦大学出版社出版了《Nature’s Pharmacopeia—A world of medicinal plants》(以下简称‘Pharmacopeia’)一书。Dan Choffnes 博士多年来一
目的:通过对五香饮治疗缺血性脑卒中后痰瘀阻窍气机郁滞型顽固性呃逆的临床观察,研究其作用机制,进一步探讨缺血性脑卒中后顽固性呃逆病因病机与辨证思路,并丰富其治疗的方法。方法:患者选取来源于山东中医药大学附属医院泰安市中医医院脑病科病房,分析符合条件并确诊的缺血性脑卒中后出现顽固性呃逆的患者,辩证属痰瘀阻窍气机郁滞的患者60例,按照随机数字表法,将纳入的病例随机分为对照组(盐酸甲氧氯普胺足三里穴位注射
多机器人系统具有自适应性,并行性和可扩展性等优势,在制造、军事、教育和服务业具有广阔的应用前景。机器人之间的协同合作问题在该领域具有良好的研究价值和应用前景。机器
自然场景文本检测与识别研究是计算机视觉领域的一个重点研究方向。现今对规整的扫描文本的检测识别技术已经达到了先进水平,但对于自然场景中的文本检测和识别,由于自然场景下字体本身和背景复杂度很高,故对于自然场景文本的检测与识别的研究仍面临技术难题,是一项具有挑战意义的课题。本文主要研究内容如下:(1)通过分析自然场景文字本身复杂多样,如扭曲变形、多颜色、字体模糊等特点,背景亦复杂多样,如背景颜色多样、图
截至2019年底,中国铁路营业总里程达13.9万公里以上,其中高速铁路近3.5万公里。随着我国高速铁路技术的快速发展以及全国交通需求的日益增长,同时高速铁路逐步呈现出运行线路
随着现代工业设备的日益复杂,故障检测与诊断(FDD)技术可以有效地提高系统的安全性和可靠性,因此受到越来越多的关注。目前,关于离散系统的状态和故障估计问题的研究还不够充分。本文将在前人的工作基础上,研究离散线性变参数(LPV)系统状态和故障的估计问题。主要研究工作如下:针对含有执行器故障和传感器故障的离散LPV系统,提出了一种同时估计系统状态、执行器和传感器故障的观测器设计方法。该方法能够有效地抑
癌症严重危害人类健康,化疗是目前治疗癌症最有效的手段之一。化疗药物诱发的神经痛是癌症化疗过程中出现的最常见、最严重的并发症之一,主要症状包括机械痛敏、冷痛觉异常、感觉缺失等,严重影响癌症患者的生活质量,并且可能导致化疗的中断。然而目前临床上尚无明确有效的预防治疗手段,因此急需开发新型镇痛药物。烟碱型乙酰胆碱受体(nAChRs)是一类广泛分布于中枢、外周神经系统的配体门控离子通道,与多种疾病的发生有
CT成像技术是放射科医生进行临床医学影像辅助诊断的重要手段,具有图像对比度和分辨率高的优势。但是,由于组织病变、支气管以及胸膜附近异常等因素的干扰,进行胸腹部检查时需要准确分割相关解剖结构。本文针对CT图像中肺实质和肝脏血管的分割问题,提出改进算法以提高二者的检测与分割的准确性。主要工作为:(1)提出一种融合Surfacelet变换与脉冲耦合神经网络(PCNN)的肺实质分割算法。首先,通过Surf