自适应裂变聚类算法的研究及应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:bestdzik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是当前的研究热点,聚类分析是数据挖掘技术中最经典、最常用的技术之一.聚类分析被广泛应用于许多重要的研究领域,如:气候研究、计算生物学、生物物理学、生物信息学、神经科学、金融以及经济.得益于现代自动监测技术的发展,研究人员能获得越来越多的数据.对于自动监测设备获得的数据集,数据样本总量和数据维度是可以获取的信息.但是,数据集的总类数一般都是未知的.现有的聚类方法大部分都需要输入参数,有些算法需要总类数作为输入参数.对于自动监测的数据集,研究者并不知道要输入什么样的参数值才得到满意的聚类结果.因此,无监督自适应的聚类算法更符合自动监测数据集的需求.基于这个背景,本文着眼于构造无监督自适应的聚类算法,并用之处理重要的现实问题.本文的主要内容从以下几个方面展开:1)提出裂变聚类算法(FC).基于自动监测数据集的背景,本文构造不需要输入参数也能有效执行的算法,特别是参数kc(k clusters).受原子裂变现象的启发,本文把聚类数据集当作最初裂变的原子,数据集包含的每一类当作裂变后得到的小原子,构造裂变聚类算法.为了研究数据分布空间的规律,先将数据集理想化,即第i类的边界点远离第j(j≠i)类的边界点.然后利用数据分布空间的规律提出裂变聚类算法,此算法可以自动确定数据集总类数kc,不需要输入任何参数也能有效执行.2)提出基于密度的自适应裂变聚类算法(FC-HD).为了让裂变聚类算法能适用于更一般的数据集:基于密度的所有数据集,本章先研究基于密度数据集的特点.一般情况下,基于密度分布数据集的各类中心样本点的局部密度大于各类边界样本点的局部密度.本章利用不同区域样本点的局部密度差异,构造自适应噪音(边界点)识别方法,并与前文裂变聚类算法结合,构造适用性更广泛的基于密度自适应裂变聚类算法(FC-HD).以基因序列数据和电信客户数据作基于密度自适应裂变聚类算法的现实案例分析.实验结果证明,FC-HD算法为健康信息管理和电信客户维护管理提供有效的方法.3)利用基于密度的自适应裂变聚类算法与预测方法结合,预测设备的使用寿命.设备剩余使用寿命的准确预测对生产活动有着重要的意义,设备寿命预测也是管理领域的研究热点.为了建立更准确的寿命预测模型,应当先筛选更有参考价值的失效样本来建模.因为同类设备在不同环境下运行,它们的退化过程会有很大的差别.随着自动监测技术发展,无监督、自适应的样本筛选算法是未来发展的需求.本章利用基于密度的自适应裂变聚类算法与相似性预测模型相结合,预测锂电池的剩余使用寿命;利用基于密度的自适应裂变聚类算法与SVR(支持向量机回归)模型相结合,预测风力发电机叶片的剩余使用寿命.4)提出基于路径的自适应裂变聚类算法(PBFC).自然界中的数据集,除了基于密度分布的数据集,还有其它分布类型的数据集.为了使裂变聚类算法能处理任意分布形状的数据集,本文利用Fischer的相似性测度函数来计算基于路径的样本相似关系矩阵.在此矩阵基础上,综合研究样本的分布密度、分布路径和分布形状,构造适用于任意分布形状数据的基于路径自适应裂变聚类算法(PBFC).人脸识别支付手段在当前的经济活动中开始兴起.重要人物的定位与追踪是信息管理的一个新研究热点.以人脸识别和其它图像数据作基于路径自适应裂变聚类算法的现实应用分析.PBFC算法能有效处理图像分割和人脸识别的数据,为重要人物的信息管理提供了新方法.本文受到原子裂变过程的启发,提出一系列新的自适应聚类算法,以此解决自动监测数据在聚类时一些算法参数无法设定的问题,并用之处理现实中的几个经典管理案例.新的自适应裂变聚类算法可将大数据集分裂成若干个较小的子集,从而简化大数据的处理难度.研究结果表明,本文所提的自适应裂变聚类算法的聚类性能优于当前其它聚类算法的性能,其时间复杂度更低,数据处理效率更高.
其他文献
学位
学位
固体火箭发动机是以固体装药为动力的化学火箭发动机,具有结构简单、工作可靠性高、维护简单、密度高等优点。固体火箭发动机的工作时间、燃烧室压力、推力等参数均与药柱的几何形状有关,因此装药设计是固体火箭发动机设计的关键环节。随着计算机技术的高速发展,虚拟现实技术在科学研究领域发挥了重要作用。虚拟仿真实验具有直接的视觉效果、良好的交互性能、平台可扩展等优点,已经成为航空航天领域的研究热点之一。本文所研究的
在大型炼钢厂,常采用多跨行车梁结构,连接加料跨、接受跨和冶炼跨,方便钢水包的运输和钢水的冶炼。吊装搬运钢水包的行车负荷大,工作频率高,对行车梁的强度和刚度提出了较高的要求。行车梁一旦出现结构性变形和损坏,比如大幅度晃动,啃轨、局部筋板开裂,甚至断裂等,势必会危及生产安全和生命安全,带来严重后果。因此,行车梁的稳定性和安全性至关重要。在设计行车梁结构时,目前普遍按照传统的钢结构设计规范进行设计,只做
现代战争中武器的远程化日益重要,近年来各种各样的增程技术被各种型号武器所采用,炮射火箭增程技术作为其中使用较多的增程方式之一,被各国研究者进行了深入的研究。由于增程火箭在其炮射阶段需承受极大的发射载荷,且在发动机点火时还要承受点火所带来的高压强,因此研究发射过载及点火冲击对推进剂结构完整性的影响变得十分重要。本文首先通过改性双基推进剂的准静态压缩实验及高应变率霍普金森杆实验,对推进剂在宽泛应变率下
质子交换膜燃料电池(Proton Exchange Membrane Fuel Cell,PEMFC)是一种将氢能直接转化为电能的新型发电装置,具有效率高、无污染等优点,在新能源载具、分布式发电等领域有着广泛应用。然而在相关的应用研发中,实体电堆的使用会带来辅助设备控制以及氢气存储等一系列复杂问题。因此可以搭建PEMFC模拟器模拟真实电堆的输出特性,并代替实体电堆为后级电路供电。本文根据PEMFC
学位
近年来,我国飞行器领域发展迅速,飞行器内部参数的测试直接影响了飞行器的正常运行和模型分析。其中,对飞行器内部各舱室温度的测量结果是一个重要参数,工作人员需要实时监测飞行器各部位工作温度,以确定飞行器工作状态。针对较为复杂的飞行环境,本文设计了一种基于OFDM(Orthogonal Frequency Division Multiplexing,正交频分复用技术)的总线测温系统。OFDM技术在飞行器
纳米结构设计是提高超级电容器电极材料性能的有效途径之一,根据电化学性能需求的不同,如高比电容、高倍率性能、高循环性能、高能量密度等,可从不同角度对电极材料进行纳米结构的设计与制备。镍基材料作为超级电容器电极材料中较为常见又特殊的一类电极材料,在其实际应用中面临着许多挑战。而通过巧妙设计镍基材料微观结构并合理构建其复合材料的策略,可提高其在微/纳米尺度上的电化学反应和电子传输性能,有效改善其电化学性
随着现代科技的发展和精密加工元件的大量使用,对加工元件表面的粗糙度等面形参数检测精度提出了更高的要求,为了适应工业化生产现场检测的需求,对检测仪在性能、精度以及功能等方面提出了更高的要求。本文利用白光显微干涉测量与相移技术相结合的方法,对光机系统结构进行集成化设计,研制微型白光轮廓仪,实现了对精密加工元件表面粗糙度的高精度、快速测量。以点金刚石车床生产光学元件的现场粗糙度测量为目标,分析了高端白光