基于计算智能技术的聚类分析研究与应用

被引量 : 51次 | 上传用户:mumurong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类属于无监督学习,是将数据集中的数据对象分成多个簇或者类,使得在同一个簇中对象相似度高,而在不同簇中对象的相似度低,因此,对空间数据对象的聚类可通过基于聚类目标函数的优化问题来解决。从这一思路出发,将自适应能力及鲁棒性较高的计算智能技术应用于聚类分析,产生了很多基于计算智能技术的聚类分析模型。基于计算智能的聚类分析成功解决了数据的聚类问题,对处理目标的特性有良好的适应能力,弥补了传统聚类方法的不足,取得了良好的效果。计算智能方法主要包括神经网络、模糊控制、进化计算、混沌科学、免疫计算、DNA计算及群体智能等。近年来,神经网络、模糊逻辑和进化计算三个方向的研究成为热点。自组织映射(SOM)是最有代表性的神经网络聚类方法;遗传算法、进化策略、免疫规划、克隆学说、蚁群系统、微粒群优化、文化算法等进化计算已成功应用到聚类分析中;另外,在传统聚类分析中引入模糊集概念,产生了模糊聚类算法;根据计算智能技术的优缺点,将一些计算智能方法融合起来应用于聚类分析,提高了聚类的能力。论文将神经网络、遗传算法等计算智能技术用于聚类分析,构造聚类分析模型,研究该模型的定义及优化方法的特点和不足,改进或提出相应的解决方法;另外,针对模型在聚类分析中的应用研究并结合离散Morse的相关理论和方法,研究离散Morse理论在聚类分析中实现的关键技术和方法,并提出基于Morse理论的聚类分析模型以适应具体应用的要求。通过实验,验证了模型的有效性和可行性。本文的主要研究内容如下:1.针对传统SOM网络模型用于聚类分析时竞争层神经元个数须预先指定的缺点,给出了在训练过程中动态确定网络结构和单元数目的解决方案,提出一种新的动态自组织特征映射模型,并给出模型的训练算法。此算法初始只有一个根结点。在网络训练过程中不断产生新结点。新的结点可在任意位置根据需要自动生成。当训练算法结束时,根据得到的树形结构确定聚类的数目。算法中通过扩展因子控制网络的生长,实现了不同层次的聚类。算法采用两阶段的训练思想。当算法的生长阶段完成后,利用模糊C-聚类的思想,对生长阶段产生的粗聚类结果做细化处理,从而提高最终聚类结果的精度和算法的收敛速度。通过UCI数据集来验证该模型的有效性和优越性,并对其聚类的有效性进行对比分析。2.介绍了谱聚类技术及相关概念,对谱聚类算法进行研究及分析,提出一种自动确定聚类数目的谱聚类算法。为了解决CLARANS算法易收敛于局部最优及面对大数据集聚类效率不高的问题,结合遗传算法易于找到全局最优值的特点,将遗传算法和CLARANS算法相结合,提出基于GA的聚类分析模型,并通过选择合适的适应值函数,达到聚类的目的。通过实验证明了新算法的的优越性3.介绍了离散Morse理论的基本原理及相关概念,提出一种构建离散Morse函数求最优解的算法,并证明了构建的函数是最优的离散Morse函数,同时构建了一种基于离散Morse理论的优化模型,实验的结果证明了该模型的有效性。这是一个全新的尝试。4.把基于离散Morse理论的优化模型应用于聚类分析,提出一种基于离散Morse优化模型的密度聚类算法。聚类后的结果运用层次聚类的思想进行优化,可以通过参数的调整来控制聚类簇的数目,达到聚类效果。实验证明新算法的可行性及有效性。本文的创新点总结如下:1.提出一种新的动态SOM模型。该模型采用新的生长阈值函数,训练算法采用两阶段思想。实验在UCI数据集上进行,通过与SOM模型、FCM算法及TreeGNG对比验证了该模型的有效性和优越性。2.提出一种基于GA的自动谱聚类算法GA-ISC。通过改进的谱聚类算法ISC-CLARANS达到自动产生聚类结果的目的。引入GA提高CLARANS算法的执行效率。实验分别在人工数据集及UCI数据集上进行。实验证明ISC-CLARANS算法正确、有效。通过GA-ISC与ISC-CLARANS算法的聚类结果比较,验证了GA-ISC算法的高效性。3.提出一种基于离散Morse理论的优化模型,该模型通过在单纯复形上构造离散Morse函数来实现。实验结果证明了该模型的正确性及有效性。4.提出一种新的基于离散Morse优化的聚类模型。该模型在离散曲面上进行。聚类后的结果运用层次聚类的思想进行优化。实验在人工数据集及UCI数据集上进行,通过与DBSCAN算法的聚类结果比较,验证了新模型的高效性及优越性。
其他文献
初中生生理逐渐成熟,思维能力也发生了变化,在生活中他们对应的社会地位和社会责任也发生了改变。在学校责任意识培养过程中,思想品德课作为一个重要途径,承担着对学生进行责任意
目的:研究雷尼替丁联合多潘立酮用药在慢性胃炎治疗中的应用。方法选取2013年9月~2014年9月在我院治疗的慢性胃炎患者共120例,随机分成两组,每组各60例,对照组采用雷尼替丁进行治
在Ridley峰值电流模式控制的Buck变换器模型的基础上,提出一个包含传导损耗的修正模型。运用平均开关建模法,建立非理想PWM开关的非线性大信号平均模型,包含全部寄生电阻和二
本文选取2014年上交所A股上市公司为样本,分析了董事会特征、投资者关系管理与公司价值关系。研究发现:我国上市公司投资者关系管理水平普遍偏低,相关性检验显示变量之间无明
各支球队在世界杯赛场上的表现反映了现代足球技战术发展的一些主流趋势。随着现代足球的发展,当今足球运动逐渐呈现新的发展趋势,攻防转换加快以及快速反击成为球队制胜的法宝,保持高的控球率已不再是赢得比赛胜利的保障。球队整体水平的发挥不仅决定了比赛的胜负,也体现了进球得分的特征,而射门进球得分才是赢得比赛的关键。本文主要运用文献资料法、专家访谈法、录像观察法、数理统计法和逻辑分析法等方法,研究2018年俄
我国第六次人口普查数据显示,2010年我国60岁及以上人口为1.7 8亿人,占全国总人口的13.26%[1],我国人口老龄化严重。据卫生部统计:我国60岁以上人群患病率是一般人群的2.3倍~3
期刊
本文介绍了涡电流传感器在周向振动钻床主轴运动参数测试中的应用,找出了主轴运动参数与控制部件--变频器输出参数之间的关系,现场实验表明,使用本文所选用的传感器和所找出
目的分析他汀类药物联合低分子肝素钠治疗冠状动脉粥样硬化性心脏病的临床疗效。方法收集我院于2015年5月-2017年2月收治的冠状动脉粥样硬化性心脏病患者78例,并均分为观察组
目的分析酶联免疫吸附试验(ELISA)法检测血清中的肠道病毒71型IgM(EV71-IgM)抗体对诊断手足口病的意义。方法用酶联免疫法对86例(其中5例重症患儿)临床诊断为手足口病患儿血