基于深度学习的多模态聚类分析

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xiaozao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多模态数据是从多个来源或特征子集获得的数据。例如,一个人的身份可以通过从字迹、指纹、面部、眼睛虹膜等多个来源获得的数据进行识别,而一张图像可以用其颜色和纹理特征来表示。大数据时代的来临,对所有数据进行标注是非常困难的,而聚类算法可以根据样本之间的相似性关系对其自动分组,所以,近年来针对多模态数据的聚类算法得到了越来越多的关注。多模态聚类的关键在于探索各模态数据间的共享信息,传统的多模态聚类算法只能提取样本的浅层特征,不能有效挖掘出隐藏在数据中间的更深层次非线性特征。与此同时,深度学习通过模拟人脑的认知过程,可以对特征进行很好的非线性变换,从而提取出多模态数据的更深层特征。基于此,论文针对深度多模态聚类算法进行研究,主要内容如下:1、针对现有的基于自编码器的深度多模态聚类方法仅使用重构损失不能保证重构样本与原始样本间主要信息的一致关系,导致不能有效提取用于聚类的多模态潜在描述这个问题,提出了一种新颖的深度对抗多模态聚类(Deep Adversarial Multi-modal Clustering Network,DAMC)网络,使得各模态学习到的潜在描述可以互相生成原始样本,且不丢失主要信息,获得更具有一致性的聚类结构。具体而言,采用多模态编码-生成网络提取每个模态潜在描述并使其生成所有模态对应的重构样本,保证了各模态潜在描述间的独特性与共享性。同时,使用判别网络和均方误差共同约束生成的重构样本并不丢失原始样本的主要信息,保证了所提取潜在描述的有效性。此外,采用加权自适应学习来获得共享潜在描述,并嵌入聚类网络以进一步提高聚类性能,利用1,2范数约束共享潜在描述,使其具有区分性。在视频、图像和文本数据集上的实验结果表明,该方法优于其他多模态聚类方法。2、为了解决现有的深度多模态子空间聚类算法没有同时考虑模态内和模态间数据的几何分布关系,导致聚类效果较差这个问题,提出了基于对抗t-SNE的多模态子空间聚类(Adversarial t-SNE for Multi-modal Subspace Clustering,At SNE)算法。该算法利用对抗t-SNE网络来使得卷积编码器学习到的每个模态的潜在描述和所有模态共享潜在描述的分布保持一致,并采用自表达层学习一致的聚类结构,保证聚类结构包含模态内数据和模态间数据的几何分布关系。最后,采用卷积解码器来重构数据样本,以确保编码后的特征可以保留原始数据的信息。在四个多模态图像数据集上的实验结果表明,该算法具有优越性。
其他文献
随着国内体育产业的大力发展及全民运动的普及,消费者对运动产品的需求也不断增长,国内运动品牌的品牌价值也逐步提高。然而,因为目前市场竞争激烈的扩大,中国体育用品品牌在
在整个松南气田中,东岭地区营城组的火山岩属于整个气田外围的火山岩,在该地区油气资源非常丰富,且火山岩储层的发育状况相对较好。在另一方面,由于该地区的火山岩分布范围相对较广,且各个区块之间的差异性相对较大,造成研究区火山岩储层非均质性较强,所以目前对该地区火山岩的认识尚不明确,这严重制约了该地区目标区块的优选工作,也对下一步的井位部署产生了严重的影响。针对上述问题,本次研究首先对钻井、测井、地震以及
近年来,作为可充型的储能器件,超级电容器得到了飞速的发展。作为超级电容器性能的决定性因素,电极材料的制备方法和性能研究成为当今科学发展的首要目标。其中,二氧化锰作为超级电容器的正极材料,具有资源丰富、环境友好和较高的理论比电容等优点,因此受到广泛的关注和探索。但作为单一的电极材料,在电容性和稳定性等方面仍具有明显的不足。为了解决这一问题,在本论文中设计并制备了一种多孔核-壳结构的正极材料,利用XR
随着中国农村集体经济快速发展,农村集体经济组织所拥有的经营性资产、非经营性资产和资源性资产(以下简称“三类”资产)管理问题已成为政府部门工作的重点和难点。面对新形
本文对于淮南市采煤沉陷区综合治理模式和沉陷土地利用展开了研究。通过分析沉陷区地质概况和沉陷特点,市域煤炭企业运营状况,沉陷现状;回顾“十二五”期间淮南市采煤沉陷区
流量混淆协议Obfs4是匿名通信工具Tor用来抵抗流量检测以提高网络可用性的主要机制。在真实环境中,针对Obfs4的流量检测面临以下几个问题:1)Obfs4极强的抗检测能力:Obfs4协议采取改进型椭圆曲线加密算法,对数据包全部内容进行加密,因此数据包头部和负载都不具有任何有效的明文信息,可以抵抗所有基于数据包明文信息的流量识别算法。对数据包负载部分Obfs4还使用随机填充的方式,使数据包长度分布
共振式消声器常被用于降低汽车排气系统噪声,但消声器实际工作时存在高速高温气流,使消声器消声性能难以达到理想效果,因此研究消声器有流时消声性能具有一定的实际意义。本
石墨烯(graphene)具有二维网状结构,它的单层碳原子以蜂窝形状的碳网结构存在。理论上,石墨烯单层厚度为0.335 nm。石墨烯优越的性能使其在众多领域具备非常广阔的应用前景。为了实现石墨烯低成本、高质量的制备以及探究石墨烯的基础应用,本文主要开展了如下工作:(1)以金属氯化物作为插层剂对天然鳞片石墨进行插层,成功制备得到了一阶的石墨层间化合物(Graphite intercalation c
随着计算机技术、电子信息技术、机器视觉技术的发展,移动机器人已经在仓储物流、餐厅及个人家庭等领域有了广泛的应用。自主导航实现是移动机器人的必备能力,是执行其它各种任务的基础。同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)和路径规划作为自主导航系统的两大关键技术,一直是移动机器人领域研究的重点方向。融合视觉的SLAM技术因含有大量的图像信息
膜生物反应器(MBR)是一种高效的水处理技术,其有高质量可循环利用的处理水和能源。但是,膜污染是MBR工艺的主要缺点,主要原因是其会导致渗透率下降。膜通量或跨膜压力(TMP)随处理时间的增加而增加,导致膜的运营成本增加,最终缩短了膜的使用寿命,因此,膜污染仍是限制MBR发展的主要问题。微生物燃料电池(MFC)处理污水时,可将有机物中的化学能转化为电能,并产生清洁能源。本实验将MFC与MBR组合在一