基于秃鹰搜索算法优化K-Means的动态特征子集聚类研究

来源 :东北林业大学 | 被引量 : 0次 | 上传用户:wish_hjl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动聚类的过程简化了数据挖掘内部规律的模型,进而可以针对未知的海量无标签数据进行有效分类,便于人类进行合理的数据资源开发利用。聚类分析是十分重要的数据预处理工作,大数据时代下各领域的数据计算需求逐渐变高,现有部分方法已无法有效处理大容量、高维度数据,需要更精确的自动聚类方法改善数据挖掘能力。K-Means算法是一种运行稳定、简单高效且聚类性能优秀的方法,其在医学、管理、生物学等领域中具有稳定的应用基础,但受算法自身的因素以及数据结构类型等的影响,常常在某些数据聚类分析效果中表现不佳。秃鹰搜索优化(bald eagle search,BES)算法是一种新颖的启发式群智能优化算法,该算法具有良好的全局空间搜索能力,能够有效地解决各类复杂数值计算问题,但也存在寻优速度慢、收敛陷入局部最优的缺点。因此本文分别对BES算法与传统K-Means算法进行改进研究,并将其应用于K-Means的动态子集聚类分析中,改善传统数据聚类分析的性能。全文主要研究内容如下:1)针对标准BES算法的自身存在局部搜索能力弱,优化某类特定问题时求解能力低,后期收敛速度慢等,本文通过引入混沌初始化策略、莱维飞行策略、模拟退火机制以及光的折射学习策略加以改进,综合提升算法计算求解精度与收敛能力。采取CEC2005标准函数测试改进秃鹰搜索优化(improved bald eagle search,IBES)算法的可行性及有效性,提升了原算法的搜索寻优能力。2)针对传统K-Means算法自动聚类过程的簇群中心受离群值影响较大,聚类效果受限于数据形状与结构以及欧式距离度量性能不良。本文采取自适应Tukey法则、特征选择的核K-Means及角度差均方根误差值的相似性距离度量加以改进研究,提出改进K-Means(improved K-Means,IK-Means)聚类方法,采取UCI数据集进行聚类分析实验,综合测试IK-Means算法的有效性与可行性,聚类效果得以改善。3)针对初始聚类中心选取不佳影响聚类分析的效果,本文提出将IBES用于优化IK-Means初始聚类中心位置更新的方法。通过UCI数据库的16个经典数据集以及2个人工数据集进行仿真测试,采取分类准确率、轮廓系数、运行时间、F1值及适应度值(均值、标准差)综合评价算法性能,验证了算法在聚类分析时的优越性与有效性。4)将本文提出的秃鹰搜索优化K-Means算法用于现实肝细胞癌数据集的聚类分析中,实验结果表明本文算法分类准确率可达86.18%,较其他方法聚类时具有更准确的分类效果,进一步证实了本文算法在实际应用问题中的有效性。
其他文献
农田杂草肆意滋生会危害农作物的生长造成产量减少。使用化学农药的传统除草方法虽然可以高效治理杂草,但是面临土壤环境污染和农药残留等问题。基于传统数字图像处理和机器学习的杂草图像分割方法要求大量的专业知识和繁琐的特征提取过程,其分割精度比较低、应用性较差。基于深度学习的田间杂草图像分割方法兼顾了精度与速度,为精准智能除草的提供了有效的技术支持。但是,现有的深度学习田间杂草分割模型受作物与杂草相互遮挡、
学位
红色文化资源的精神内涵与其独特的价值是中国共产党艰辛而辉煌的奋斗历程见证,是社会主义先进文化的重要组成部分,是高校思政课堂的优质资源。将红色文化资源融入高校思政课中,有助于提升思政课的教学效果,发挥思政课铸魂育人的引领作用,使新时代青年能够坚定文化自信,以其铸魂固本。当前红色文化资源融入高校思政课中存在着对红色文化资源挖掘不充分,教学方式单一的现实困境,故须充分挖掘运用红色文化资源,并改革创新教学
期刊
东北虎是世界濒危物种,也是最有希望恢复种群的大型猫科动物。生物多样性是生物及其环境形成的生态复合体以及与此相关的各种生态过程的综合,包括动物、植物、微生物和它们所拥有的基因以及它们与其生存环境形成的复杂的生态系统。生物多样性是人类赖以生存和发展的基础,且保护生物多样性是我国生态文明建设的重要内容。保护老虎一方面可以维持栖息地的生物多样性,另一方面也是呵护人类和老虎共同的家园,有利于实现人类文明可持
学位
为提升传统吸声材料的低频吸声性能,通常采用设置背腔或增加材料厚度的方法,但是这些方法将限制吸声材料在空间受限环境下的应用。近年来,新型吸声材料中的声学超材料成为解决低频噪声的有效手段,然而声学超材料对加工技术和材料的要求也更高,以致大部分还处于试验研究阶段。另一种低频新型吸声材料是复合型材料,该材料的吸声性能较好,但是复合型材料在低频吸声需要组合低频吸声材料或结构。因此,开发低频吸声材料或结构是噪
学位
利用木材染色技术对人工速生木材单板表面的颜色特征进行改善,是提高人工林木材利用率的一种重要手段。在木材染色技术中,如何快速、准确地对染色配方进行预测是重点、难点之一。目前木材染色领域多采用颜色三刺激值来对染色配方进行预测,该方法虽然具有一定的预测精度,但无法避免“同色异谱”现象。为解决这一问题,本次研究以速生杉木单板为染色基材,在确定其最佳染色工艺的前提下,对其进行染色并构建了试验样本。然后从染色
学位
脑胶质瘤是起源于脑神经胶质细胞的原发性肿瘤,发病率约占全部颅内肿瘤的45%。脑肿瘤的早期诊断与治疗对于患者生存率的提高至关重要。磁共振成像(Magnetic Resonance Imaging,MRI)是脑肿瘤检测的主要手段,MRI是一种具有良好软组织对比度的无创技术,能够显示详细而完整的脑部肿瘤。但是由于脑肿瘤外观的高度异质性,多模态MRI图像的脑肿瘤分割是医学图像分析中极具挑战性的难题。基于医
学位
生物质热解油因可再生和碳中和的特点而广受关注,能够一定程度上缓解能源紧缺和环境污染问题,但着火性差、热值低、腐蚀性强等诸多不利因素限制了其使用场景,需要有针对性地提质以提高热解油的品质。因此,本文提出萃取分离、催化酯化烷基化和O-甲基化复合提质生物质热解油的方案,并燃用提质生物油/柴油混合燃油以考察提质生物油对燃烧和排放特性的影响。主要研究内容如下:(1)复合提质生物质热解油的制备及工艺优化的研究
学位
模块化多电平换流器(Modular Multilevel Converter,MMC)具有拓扑结构模块化程度高、输出波形谐波畸变率低、开关器件运行损耗小等优点被广泛应用于柔性直流输电系统中。但由于其内部子模块数目多,控制复杂,遇到外部或内部故障时会直接影响系统的能量转换,因此,如何构造MMC子模块拓扑结构成为了相关研究的热点问题。本文针对混合型MMC(Hybird MMC,HMMC)的拓扑结构,围
学位
当今,人类社会对化石能源的依赖导致能源紧缺与环境污染问题日益严重,开发一种可以代替传统能源的可再生能源对可持续发展、优化能源结构和实现碳中和至关重要。在可再生能源中,生物质能具有相当大的潜力,可以通过生物质催化热解技术获得高品质生物燃料及化学品。在生物质催化热解过程中,微孔分子筛HZSM-5被认为是最有效生产芳香烃的催化剂,但其容易结焦失活。而赤泥(RM)具有高比表面积、多孔结构和大量的活性金属氧
学位
“大思政课”是新时代推动思想政治理论课改革创新的重要理念,红色文化是中华优秀传统文化与中国革命文化相结合的产物。立足“大思政课”视域推进红色文化教育对提升思想政治教育感染力,挖掘红色文化的时代价值,坚定共产主义理想信念都具有重要意义。在“大思政课”视域下推进红色文化育人的过程中,要从办好大课程、建好大队伍、形成大机制三个方面规划育人路径,充分发挥红色文化在新时代的育人价值。
期刊