【摘 要】
:
聚类分析是无监督学习方法里最常见的研究方向,且在电子商务中的商品推荐,新闻及短视频中的信息分发等领域上有非常广泛的应用。随着大数据时代的到来,聚类所面临的数据集,无论是在样本数目还是数据维度方面规模都越来越庞大,导致单一的聚类算法开始变得难以适用,因此,借鉴了集成学习思想的集成聚类算法便应运而生了。论文在研究过几类基于不同理论的集成聚类算法的原理后发现,针对集成聚类算法的不足,如未考虑到数据样本到
论文部分内容阅读
聚类分析是无监督学习方法里最常见的研究方向,且在电子商务中的商品推荐,新闻及短视频中的信息分发等领域上有非常广泛的应用。随着大数据时代的到来,聚类所面临的数据集,无论是在样本数目还是数据维度方面规模都越来越庞大,导致单一的聚类算法开始变得难以适用,因此,借鉴了集成学习思想的集成聚类算法便应运而生了。论文在研究过几类基于不同理论的集成聚类算法的原理后发现,针对集成聚类算法的不足,如未考虑到数据样本到样本中心的距离,不同基聚类器聚类的效果存在差异等问题,可改进的层面主要集中在数据样本点,基聚类器聚类得出的簇以及基聚类器的聚类结果这三个层面上,因而论文主要针对集成聚类算法中共协矩阵的构建过程,提出了这三个层面上的改进,改进内容如下:
为了在数据样本点层面上对集成聚类算法进行改进,论文提出了一种基于Parzen窗原理的计算数据样本对的隶属概率的方法,将其应用在共协矩阵的构建中,并设计了对比实验。实验结果表明,相对于经典的集成聚类算法,数据样本点层面上的改进能在常用的聚类评估指标上带来平均151.02%的提升。
为了在基聚类器聚类得出的簇层面上对集成聚类算法进行改进,论文提出了一种基于KL散度原理的计算方法,用于计算基聚类器聚类得出的簇重要度,该方法从簇层面上改进了共协矩阵的构建。对比实验的结果表明,相比于其他在数据样本点和簇层面上的改进集成聚类算法,论文中结合这两个层面的改进取得的聚类效果能带来平均5.53%的提升。
为了衡量不同基聚类器的聚类效果,在基聚类器层面上对集成聚类算法进行改进,论文提出了一种基于帕累托最优原理的对基聚类器赋权的方法,根据基聚类器表现的好坏赋予不同基聚类器不同的权值。通过与同样在多个层面上进行改进的集成聚类算法进行对比实验,论文结合数据样本点,簇以及基聚类器三个层面上的改进在聚类效果上取得了平均46.16%的提升。
其他文献
差分吸收激光雷达技术是远程微量气体探测的先进遥感技术。该类探测系统在大气环境监测和特定目标监测等方面具有广阔的应用前景。对于该类探测系统的研究,国外已经研制出部分实用的探测系统,而我国目前窄吸收谱线气体探测主要还处在探索阶段。根据应用的迫切需求,本文开展了相关理论和实验研究工作。 根据国外理论和实验研究的成果,对于CO2这类光谱吸收线非常窄的气体,对应的差分吸收激光雷达探测系统,激光稳频技术是最
本论文针对应用于无线传感器网络节点接收机的流水线模数转换器(ADC),重点研究了流水线ADC的电路设计技术和低功耗设计方法,使用0.18μm混合信号CMOS工艺设计并实现了两款1.8V40MS/s的中等精度流水线ADC。 在系统设计方面,首先对流水线ADC的非理想误差来源进行了全面的理论分析,讨论了各种非理想误差对流水线ADC性能的影响,推导了满足精度和速度要求的电路设计指标和采样电容值。接着建
随着无人机和并行计算等技术的发展,基于图像的三维重建在众多领域都有着相关应用。纹理映射对于提高三维模型的真实感有着重要意义,是三维重建的关键问题之一。为优化纹理映射在大规模场景下的性能,基于凸优化方法提出了高并行度的视图选择算法,提高了纹理映射算法的计算效率;利用形变信息抑制扭曲纹理生成,并实现了对三维模型的快速自适应分块,进一步拓展了纹理映射在大规模场景下的实用性;联合图像与三维模型的信息,优化
自20世纪50年代开始,光电成像末制导武器由于其高效费比,大量应用于战场。为有效保护目标,烟幕干扰技术作为一种重要的光电对抗手段被广泛投入使用。烟幕干扰严重影响了红外图像目标识别算法的性能和红外末制导武器的打击效果。相较于空中目标和海面目标,地面目标背景更为复杂,对抗烟幕干扰的难度也更大。如何在烟幕干扰条件下有效地提高地面目标识别算法的性能是亟待解决的问题。论文针对该问题,在红外烟幕干扰图像特性、
图像协同分割任务旨在从一组图像中分割出它们共同包含的目标,这对帮助研究者从海量网络图像中获取感兴趣的物体具有很大的益处,是当前人工智能研究热点之一。尽管关于协同分割的研究已经有较长的历史,但基于深度学习的研究仍存在很多需要深入探讨的问题。当前基于深度学习的协同分割模型利用孪生网络结构提取一对图像的语义特征,再对语义特征执行特征对比,并基于对比后的特征解析共同目标所在的区域。虽然当前的模型的性能相较
眨眼作为人体的一个典型动作,预示着个体当前的生理和心理状态信息。近些年来,人们逐渐发现眨眼检测可以广泛应用于日常生活中的众多领域,诸如活体检测领域里的行为活体确认,医疗领域的干眼症恢复,刑侦领域的测谎以及辅助驾驶领域的疲劳检测。因此,近十年诞生了大量眨眼检测相关的工作,也取得了较为可喜的结果。但是,目前的方法大多数集中于在特定受约束的数据集上,进行眨眼检测,这与现实生活中的非受限情况相距甚远。因此
随着人工智能时代的到来,越来越多的机器人融入到生产过程中。它们将人类从繁重和重复的劳动中解放出来。随着机器人数量的增加和生产柔性需求的提升,机器人将面对更大的碰撞风险和运动规划的运算压力。 论文以流水线物流分拣堆码为场景,以两个六自由度机械臂为研究对象,使用基于概率采样的随机路标法,设计了多自由度机器人实时运动规划系统。对于码垛形成的障碍物,论文设计了静态码垛碰撞检测加速器,通过改进基于空间分割
随着老龄化人口的增多,阿尔兹海默症(Alzheimer’s Disease, AD)带来的社会问题也日益凸显。作为一种现阶段无法治愈的疾病,如何尽早地对患者进行识别以便进行早期干预减缓病程成为一项具有重要意义的研究工作。深度学习方法的兴起为AD识别方法的研究注入了新的活力,本文对基于深度学习的AD识别方法进行了探索和研究,主要研究内容包括: 现有基于功能磁共振影像的AD识别都是先将四维功能磁共振
计算机断层成像技术(Computed Tomography, CT)利用人体各个位置的器官对X射线的吸收程度差异,通过测量X射线穿过人体后剩余的光子数,依据Radon变换等数学原理,重建出反应人体内部器官信息的CT图像。CT成像技术可以在无损条件下获得病人内部器官的结构,故应用广泛。但过高剂量的X射线扫描会损害人体内部器官结构。临床中,多通过降低X射线管阴极电流来降低扫描剂量,但是这会让重建CT图
在荧光显微成像中,为了避免荧光分子失活并长时间观察细胞活动,通常需要采用低剂量荧光染料,此时相机捕捉到的图像也会伴随着明显的噪声。此外采用传统方式所获取的点扩散函数(Point Spread Function,PSF)可能会存在误差,并不能直接用于解卷积去模糊。本文研究在未知准确的PSF前提下,基于正则化的半盲复原以及基于深度学习的图像盲复原方法来去除图像中的噪声和模糊,并最终成功应用于宽场和结构