基于变分自编码及混合模型的聚类分析

来源 :华侨大学 | 被引量 : 0次 | 上传用户:qncy1239o
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当代人们的生活不断出现快生活,更便利的口号。人们的日常生活越来越便利,还不断地产生各种各样的数据。这些数据就汇聚成了能反映现实世界的数据海洋。为了充分发挥其蕴涵的价值,就需要可用且有效的数据挖掘技术进行数据分析,聚类分析就是其中一种。不管是隐藏在数据中的商业价值还是学术研究价值,都可以用针对性不同的聚类算法挖掘出来。目前,如果在直接可观的低维数据空间进行分析,已经存在许多使用传统聚类方法的算法模型能满足问题要求和用户需求。但是,在许多实际场景的应用中,收集到的数据逐渐表现出高维度性和非高斯性等现代数据特征。因此,现有的传统聚类方法已经无法满足聚类分析的要求了。而深度学习的出现给这个难题带来了解决思路,它可以发现复杂数据中存在的隐藏结构,并推动模型自动迭代更新参数以优化模型。因此本文将深度学习中的无监督生成模型变分自编码与混合模型相结合用于聚类研究,不仅实现对数据特征的自动提取,还可以在一定程度上避免发生维度灾难。本文将混合模型嵌入变分自编码框架中,提出两种无监督聚类方法:(1)基于变分自编码和学生-T混合模型的无监督图像分类此方法针对基于变分自编码的传统聚类算法,其网络特征损失过大不能有效提取潜在的,分层的特征表示;基于高斯混合模型的聚类算法,其对于数据中存在的离群点敏感,不能准确地描述具有重尾特征的数据。针对以上两个问题,本文改进传统的变分自编码网络结构,结合卷积神经网络实现层级特征提取,并且利用学生-T分布构建基于变分自编码的混合模型做聚类工作;(2)基于变分自编码和狄利克雷混合模型的无监督聚类分析在研究的进程中,本文发现基于混合高斯模型和(1)中提出的学生-T混合模型的聚类算法,不能适应于有界数据的描述与拟合;原始变分自编码中使用的基于高斯分布簇的重参数技巧是不能适于狄利克雷分布的,针对以上两个问题,本文利用灵活且易用的狄利克雷分布构建基于变分自编码的混合模型来适应有界数据拟合的需求。对于使用的狄利克雷分布本文开发一种新的重参数技巧使得算法可以满足变分的要求,从而得到可用有效的模型。
其他文献
夏季平流层盛行强东风,Rossby波能量难以从对流层向上传播至平流层,而冬季平流层盛行西风,Rossby波能量容易上传,因此以往对Rossby波能量向平流层传播的研究多考虑冬季的情况
人类凭借眼睛和神经系统可以在极短的时间内发现场景中有价值的信息,若能使计算机具备这种快速信息提取能力,便可使它们高效地服务人类生活。图像显著性检测就是让计算机拥有
阅读教学是高中语文教学的重要构成部分。单纯地围绕教材文本展开阅读教学活动,难以满足高中生的学习兴趣和需求,对学生阅读能力的培养造成了一定的束缚。当前,辅助性资料作
当有限元法用于分析大型电气设备的电磁场时,需要大量的网格来获得更准确的结果,这会导致大规模的计算。但由于计算机内存和软、硬件的限制,使用传统FEM和现有商用软件无法对
火灾是日常生活中频繁发生的严重灾害,具有极强的破坏性,同时对人们的生命以及财产安全造成严重危害。如何在火灾发生的初期及时探测火灾并报警,同时避免火灾的蔓延向来是国
导航技术是武器装备信息化的一项重要支撑技术。随着对信息化战争要求的日益提高,对高精度、高可靠、全自主、全天时的导航需求越来越迫切。SINS/CNS组合导航系统作为导航技
本文以层序地层学、构造地质学、沉积岩石学、地震沉积学等理论为基础,充分利用现有的地震勘探资料结合测井数据和钻井岩心资料,对北大港北翼沙河街组地层的构造及沉积地质背
孩子的时间配置是影响其人力资本积累的重要因素。研究时间利用行为的代际传递不仅为提升孩子人力资本质量的途经提供新的视角,而且为从源头上提升经济特征(收入、教育)的代
现阶段我们主要依靠地面上的人员对电力走廊系统进行巡检,有些情况也会借助于配备有光学摄像头的直升机进行。利用这种方式进行电力巡检一方面会消耗大量的人力和物力,另一方
戏曲作为中国独特的舞台艺术形式,有着数百年的历史。由于文化多元化的发展,导致传统戏曲渐渐衰落。近年,制作的戏曲动画易被人们接受,从而可以通过把戏曲人物卡通化,来吸引