图像识别的跨域技术研究

来源 :中国科学技术大学 | 被引量 : 1次 | 上传用户:qleeanna
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别模型的训练依赖于海量的标注数据。然而,由于多种外部因素例如拍摄视角变化和背景噪声的影响,不同数据集有着不同的性质。我们将不同的数据集视为不同的域。在一个域上训练得到的分类器可能在另外一个域上有较差的性能。因此,跨域技术希望尽可能利用多个域内不同类型的数据,使之适应于不同的数据分布,从而满足不同用户、不同设备、不同环境的不同需求,获得在每个域以及未知域性能最优的模型。目前已有针对跨域问题的多种解决方法,例如,针对多域图像分类的特征共享方法和参数共享方法,针对域泛化问题的域不变特征提取方法。但是目前研究跨域技术的方法仍有不足,本论文对不同的跨域问题提出了解决方案和算法实现,主要分为三个部分:多域图像分类的紧凑特征学习;基于统一空间编码和重采样的域泛化;针对联合域泛化问题的类别交错生成器。多域图像分类任务希望利用不同域的所有训练数据,提升在每个域上图像分类的性能。对于多域图像分类问题,已有的方法将每个域中的特征提取器分解为域公有部分和域私有部分,但提取公有特征使用的对抗训练策略将一个域内不同类别的数据视为一个分布,然后去匹配这些域之间的分布。它只考虑到了不同域之间边缘分布的匹配,从而导致不同类别的数据混合在一起,降低分类的性能。另一方面,目前的方法没有保证网络不同私有特征之间的正交性质,公有特征会同时出现于不同域的私有网络,网络因此没有充分利用其学习能力。多域图像分类的紧凑特征学习同时考虑到了跨域数据之间域不变特征联合分布的匹配,以及私有特征间存在的特征冗余问题,促使网络能够学习到独立紧凑的特征子空间,使得不同性质的特征更好的分隔开,达到更好的多域图像分类的效果。域泛化旨在多个域上训练一个能够泛化到未知但相关的域的网络。对于域泛化问题,已有的域泛化算法仅仅希望缩小已知域之间数据分布的差异,没有考虑未知域上数据的特征分布,因此,网络可能过拟合到已知域的域不变信息上。另外,仅仅在已知域中的样本上训练,无法全面覆盖未知域多种变化的样本,从而限制了网络的域泛化性。基于统一空间编码和重采样的域泛化提出通过变分编码,使得生成的隐层特征服从高斯混合分布先验。这个预先定义的高斯分布缩小了已知域与未知域之间分布的差异,同时有效地将不同类别的样本分离。此外,我们提出通过利用分布约束损失的梯度扰动样本特征,从而生成了新的超出预先定义的分布但在此分布附近的样本,提升了网络泛化的性能。已有的域泛化工作仅仅解决不同域具有相同的类别的情况。但是,现实的情况往往是域的变化带来类别的变化。我们引入联合域泛化作为一种新的域泛化问题,其中不同的域具有不同的类别空间,但未知域中的类别属于所有已知域类别的并集。我们提出利用生成模型完成类别对齐,从而在样本不足情况下获取域不变信息。此外,我们对类别和域信息进行解耦,通过样本的分类损失来约束类别信息,从而突破类别限制,在每个域中生成缺失的类别的样本。进一步的,本文的贡献和创新点总结如下:1).多域图像分类任务希望利用不同域的所有训练数据,针对性的分别学习公有和私有性质的特征,学习符合联合分布匹配的公有特征,同时避免网络学习冗余特征,提升在每个域上图像分类的性能。2).针对域泛化问题,我们利用变分编码的方法,将每个类别的特征映射到一个固定隐层空间内进行重采样,有效缩小了已知域与未知域之间分布的差异。进一步,我们在这个隐层空间内,利用对抗样本的方法,生成更多的样本特征,更好的覆盖未知域样本特征,提升网络的泛化能力。3).我们关注全新提出的交错类别的联合域泛化问题,考虑更为常见的在不同域中类别不同的情况。我们希望联合地补充已知域中缺失的类别信息和提取不同域之间的域不变信息,从而提升网络的泛化性能。
其他文献
人类基因组大约含有20000多个编码蛋白质的基因,然而它们只占约2%的序列。基因组中98%的非蛋白质编码序列也被称为非编码区,其中绝大部分可以被转录为非编码RNA,它们构成了物种之间最主要的差别。由DNA、蛋白质、非编码RNA和小分子组成的分子调控网络蕴含着生命活动的基本规律,决定了细胞的命运。目前已知有大量疾病相关的突变都发生在非编码区。与非编码RNA相关的研究处于生命科学的前沿领域,充分体现了
学位
在经济金融和生物医学等领域的数据分析中,需要处理的响应变量往往取值为正.由于乘积回归模型其响应变量是非负的,成为研究这类数据集的重要统计模型.乘积回归模型又称加速失效时间模型(AFT),是生存分析的重要研究对象.乘积回归模型不仅可以研究协变量是向量的形式,同时也可以处理协变量是函数型的数据.回归模型一般以绝对误差为基础,建立估计方法,研究理论性质.然而在一些实际应用中,比如金融数据,人们往往更关心
学位
随着数据挖掘和存储技术的进步,越来越多的数据能够被获取。一方面,数据规模的激增使得研究变量的个数快速增长,各变量之间的关系也愈发复杂,形成了错综复杂的网络关系。通过对图模型结构的学习的来揭示众多变量之间所隐含的底层网络结构可以为研究者们提供更多有用的信息,在很多实际应用中具有重要的现实意义。另一方面,面对大规模的数据,假设所有的数据服从同一分布,或者具有相同的结构并不合理。实际上,对于一组大规模的
学位
大气污染作为中国十大环境问题之首一直受到广泛关注,其对大气质量、气候变化、人类健康有着显著的负面影响。地球大气中广泛存在的生物源挥发性有机物(BVOCs)是导致大气污染的重要前体物之一。在各种BVOCs中,异戊二烯和单萜烯类物质的含量最为突出。研究发现,在部分地区,一种类异戊二烯物质,2-甲基-3-丁烯-2-醇(MBO232)的浓度会达到异戊二烯的4-7倍,并且其在白天的排放量比单萜烯类物质高1-
学位
噪声问题已成为日常生产生活中的一个重要问题。对结构进行声学优化设计,能够有效提高其降噪性能,具有重要的实际意义。本文主要开展了结构声学优化分析,发展优化算法,运用等几何边界元法进行结构优化及内外表面吸声材料分布的拓扑优化研究,运用细分曲面法提高计算精度,并应用于道路声屏障、汽车内声场、消声器、潜艇、飞机等的优化设计,提高其降噪性能。论文的主要内容如下:1.基于非均匀有理 B 样条(non-unif
学位
<正>蔡宇冬和郑茵联系时,自称朱大师,从未提过自己的真名。他先收了郑茵100元给她算八字,然后提出,要超度郑茵流产的孩子的话,需要一笔压香钱,做法事的服务费和购买贡品的钱需另外计算“刘希婷最近心情可差了,你和她见面别提钱的事。”郭士坤到了河北省唐山市后,来接他的“冷哥”是这么嘱咐他的。
期刊
致密储层在全球油气资源中占比较高,随着油田开发技术的提高,开采低渗乃至特低渗储层中蕴藏的石油已具有工业价值。实现致密储层的高效开发需要应用专门的油藏数值模拟技术。目前商业软件不能准确描述我国致密油藏非线性渗流规律,并且存在裂缝处理方面的缺陷,亟需完善。对致密储层而言,其孔径在微纳米数量级,其间渗流往往表现出非线性特征,传统的线性达西定律已不能准确描述。要完成致密油藏数值模拟,需要建立合适的非线性渗
学位
液滴操控技术在现代工业生产体系中发挥着十分重要的作用,例如在微流控技术,表面自清洁技术和表面热传输性能优化等领域。传统的液滴操控技术尽管发展十分成熟,但也存在部分缺点,例如无法在复杂精密的环境中进行液滴操控,而新兴的利用非接触性马朗戈尼效应进行液滴操控的技术能够克服此类问题,因此引起了广泛的关注,但对于其中原理的揭示则普遍缺乏定量的研究,在应用层面的研究也相当匮乏。本文从实验角度出发,结合理论分析
学位
椭圆曲线在密码学上的应用主要分为:椭圆曲线密码体制、基于双线性对的密码体制和基于同源的后量子密码体制。这三类密码体制的基本运算是标量乘和双线性对,目前计算标量乘最快的方法是Longa和Sica(ASIACRYPT 2012)的4-GLV分解,计算双线性对的主要算法是Miller算法(JOC 2004)。计算4-GLV分解系数可以约化成求四维格(下文简称4-GLV约化格)的一组短基。目前求4-GLV
学位
多响应变量回归是一种重要的统计学习框架,其在自然语言处理、推荐系统、生物数据聚类等诸多领域得到了广泛应用。区别于单响应变量回归,多响应变量回归使用相同的一组自变量对多个响应变量建模,进而去估计参数矩阵。然而在当今的大数据背景下,庞大的样本量、纷繁复杂的变量种类给计算效率、参数估计相合性以及模型可解释性带来了前所未有的挑战。尤其是在高维多响应变量回归中,自变量和响应变量的规模都非常大,需要估计的参数
学位