基于多模态变分推理的深度概率生成模型

来源 :天津科技大学 | 被引量 : 0次 | 上传用户:xgzyf2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
理解和表示多模态数据一直是人工智能领域非常重要的研究课题,其中一个重要的研究分支是采用深度概率生成模型对多模态数据进行建模。近年来,基于变分自编码器框架的多模态生成模型在多模态数据的建模方面取得了丰硕的研究成果。然而,多模态数据固有的多类型、异质性和冗余性的特点使得对其进行建模仍然面临很多问题。针对这些问题,最近的研究表明将多模态数据的共享与私有信息解耦表示可以有效地提升模型推理与数据生成性能,但现有的研究工作也存在对多模态数据的信息抽取不准确等问题。针对该问题,本文发现对共享信息的对齐与融合是关键因素,因此通过引入度量学习的方法,并结合自监督学习的思路进行了研究探索,主要研究成果如下:针对多模态数据的表示与生成,本文提出一种基于自监督的多模态解耦变分自编码器模型(Self-supervised learning-based disentangling multimodal variational auto-encoder,SD-MVAE),该模型主要通过以下三种方式提高了模型解耦表示与生成的有效性:1)引入共享隐向量及私有隐向量构建多模态数据的生成机制;2)采用专家积函数将共享隐向量进行融合;3)利用基于三元组损失的自监督方法进行共享隐向量对齐。在MNIST-SVHN、MNIST-CDCB数据集上的实验结果表明SD-MVAE模型可以有效地进行数据解耦表示,相关的数据表示可以显著提升数据交叉生成、转换生成的准确度及生成图像质量,同时可以有效提升模型在多模态数据分类、跨模态检索等下游任务的效果。通过进一步的研究,本文针对SD-MVAE模型存在的模型训练参数较多,以及难以对不同模态数据进行解耦表示约束等问题,提出了一种基于四元组度量损失的多模态变分自编码模型(Quadruplet metric loss based multimodal variational auto-encoder,Q-MVAE)。该模型通过优化模型架构与模型训练目标函数,并引入四元组度量学习损失,能够使用更少的训练参数取得了与SD-MVAE模型相当的模型性能。在MNIST-SVHN、Celeb A数据集上的实验结果表明Q-MVAE模型不仅在数据表示与生成性能以及在下游任务上的效果均有良好的表现,而且该模型还表现出了对多模态数据更细粒度的解耦表示与生成的潜力,这些都一定程度展现了此模型在图像处理方面的应用前景。综上所述,本文针对多模态数据的表示与生成,在变分自编码器框架下结合了度量学习,提出了相应的模型与算法,为深度概率生成模型处理多模态数据提供了一定程度的思路与技术支撑。
其他文献
学位
己二酸除了用于生产尼龙66的单体外,还是医药中间体、粘合剂、杀虫剂、染料和食品添加剂的重要原料。下游不同工艺对己二酸原料的纯度及粒度有着不同的要求。为了明确己二酸结晶过程中的产品晶型、晶习、粒度与工艺条件及添加剂间的相互影响规律,以实现产品性质的精确调控,我们对己二酸结晶的控制步骤成核过程进行研究,并重点研究了不同类型、不同浓度的添加剂对己二酸晶体形貌的影响,以期进一步明确实际工业化生产过程中杂质
学位
随着工业进程加快,我国每年飞灰、铝灰产量分别超过1000万吨及300万吨。飞灰、铝灰成分复杂且含有较高浓度的重金属等有害物质,被我国列为危废,难以直接利用。同时,我国对天然砂石的需求逐年增加,导致了一系列的环境问题,如大规模开采岩石引起的山体滑坡和严重破坏自然景观及植被等。因此,寻求一种高效利用飞灰、铝灰的无害化、资源化利用方法对环境的健康发展有着重大意义。本文提出采用无害化处理及裹壳技术制备飞灰
学位
锂离子电池有着能量密度大、平均输出电压高、可快速充放电等特点,应用十分广泛。隔膜作为锂离子电池中最重要的组成部件之一,不仅要求有良好的电解液吸液量,还要求其有一定的热稳定性,保证电池的安全性。因此大多数隔膜采用在表面涂覆一层无机材料提升隔膜的电化学性能和热稳定性。固体电解质界面(SEI)膜形成时,锂离子电池电解液中溶质和溶剂发生电化学反应,生成SEI膜的主要无机成分,LiF和Li2CO3。本文采用
学位
聚乳酸(PLA)来源于玉米等植物,是目前应用最广泛的生物基聚合物之一,全球对PLA的需求量日益增长。PLA具有优良的生物可降解性、生物相容性、良好的力学性能和安全性。但是在PLA的制备过程中,存在中间产物丙交酯合成产率低,PLA分子量难以提高,以及PLA本身存在结晶速率慢而导致热变形温度低、韧性差等问题,这些问题直接影响了PLA的使用。本文通过调整工艺条件高产率制备丙交酯;设计正交实验优化了合成P
学位
与以往所研究的“经营村庄”不同,“新经营村庄”以项目治理为导向,运用“经营”的行为逻辑。在乡村振兴背景下,中央逐步加强“公共财政覆盖农村”的政策进程是项目进村的制度背景,中央财政的专项资金运作构成“新经营村庄”的体制性内涵。通过对村级组织经营行为的考察,从项目开源、优化配置、资源援引、产业提升的经营路径剖析“新经营村庄”的“新”经营和实践样态。研究发现,“新经营村庄”是一种以项目为要素并耦合村庄公
期刊
随着我国工业化的快速发展,在特定工业生产的过程中产生了大量的高盐含酸废水,重金属废水等一系列有毒有害的高浓废水。此类废水的组成成分复杂,水质各不相同,处理难度大,难以实现一种普适性的方法进行处理。膜蒸馏作为一种新兴的技术对高盐含酸废水处理有很好的适应性,其难点在于适宜膜材料的开发。对于不同水质要求的废水,膜蒸馏的分离膜材料需要在高温下有优异的耐酸碱性能、抗氧化性能和高疏水性能才能更好地满足废水处理
学位
本文介绍一新开发的电动汽车采用电动压缩机设计,在开空调时存在车内噪声及振动过大的问题,经测试数据对比详细分析及试验诊断后,排查出压缩机工作转速在3250rpm附近时车内振动噪声舒适性较差,通过传递路径及振动模型分析,得出压缩机在某特定转速下与压缩机支架产生共振;结合样车实际情况,在不影响性能情况下,提出改进缓冲隔振方案,并提出优化支座结构的方案;通过试验验证表明,解决方案能有效降低车内噪声和振动,
期刊
抗生素的滥用伴随着的是耐药菌带来的巨大挑战,甚至威胁到人类的健康,因此这一问题正受到广泛的关注。镓类抗菌剂由于其独特的抗菌机制吸引了人类的目光,目前比较新兴且有效的一种方法为光动力疗法。当镓离子螯合卟啉结构,一是可以构成光动力中的光敏剂有效发挥出光动力疗法的潜在能力,二是具有“铁阻断机制”,双管齐下,有效提高抗菌性能。本研究以水溶性强的阳离子改性卟啉镓(Ga-CMP)为研究对象,通过考察其对大肠杆
学位
高效液相色谱广泛应用于各个领域的分离与分析,固定相作为色谱柱的核心部分,在分离过程中扮演着非常重要的作用,受到了广泛的关注。烯烃共轭微孔聚合物(Olefin linked conjugated microporous networks,OLCMN)是一类独特的共轭微孔聚合物,具有可设计的化学结构、大的表面积、规则的开放通道,特别是在整个骨架上具有优异的稳定性和平面内扩展的π共轭体系,独特的结构使得
学位