基于深度网络的域适应算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:new_spider
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经典的有监督学习算法假设训练数据集(源域)与测试数据集(目标域)来自同一个联合概率分布。然而在很多实际任务中,如自然语言处理、图像识别等,训练数据集和测试数据集往往来自不同的联合概率分布,存在较大的分布差异。仅仅利用源域训练得到的模型,在目标域上往往表现不好。无监督域适应算法通过缩小源域和目标域数据分布的差异,利用源域上的有标签数据和目标域上的无标签数据训练模型,使得模型在目标域上有好的泛化性能。鉴于深度网络强大的特征表达能力,以及基于深度网络的域适应算法的良好性能,本文主要研究基于深度网络的无监督域适应算法。(1)提出了基于标签匹配的生成适应模型LMGTA。现有的生成适应模型,能在产生跨域样本的同时,通过域适应过程对齐源域与目标域的边缘概率分布。然而在该域适应过程中,存在着标签偏移问题,即不同标签的样本相匹配。针对此问题,本文将标签匹配思想引入到GTA模型,提出了基于标签匹配的生成适应模型LMGTA。LMGTA模型在对齐源域与目标域边缘分布的同时,将源域样本和目标域样本的标签进行匹配。实验结果表明,本文提出的模型LMGTA相比原来的生成适应模型,分类性能得到了提升。(2)提出了基于分类差异控制权重的域适应算法。针对需要伪标签的域适应算法存在的错误累积的问题,本文提出通过辨别目标域中的困难样本,降低其在域适应过程中的权重,来减少因样本难学而预测不确定所带来的伪标签错误的影响。具体地,(i)提出了基于分类差异的目标域权重策略,降低困难样本在域适应过程中的权重;(ii)提出了基于对抗学习的分类器差异控制策略,使得模型可以更好地辨别困难样本,同时促成模型从易到难的学习过程。最后将上述策略应用于现有的域适应模型MDD中,提出了改进的CDW-MDD模型。实验结果表明,本文提出的模型CDW-MDD在大多数情形下优于MDD模型,可以取得优于或者跟其他经典深度网络方法相当的效果。
其他文献
量子群的研究是当代数学的主流方向之一,它与表示论,代数几何,调和分析,共形场论和纽结理论有着紧密的联系,在很多数学领域中有重要的应用。量子群由李代数的泛包络代数量子化形成,可以由代数方法和几何方法实现,这两种方法在表示论中有着重要的作用。量子Borcherds-Bozec代数在2016年由Bozec提出,是一类新的量子群,具有重要的研究价值。本文考虑量子Borcherds-Bozec代数Uq(g)
学位
量子信息学是一门新兴的交叉学科,以量子力学与信息学为基础,并融合了数学和计算机科学等学科.量子纠缠是量子信息学中一种重要的物理资源.更加深入地研究量子纠缠的基本性质和基本特征可推动量子信息学的发展.然而,在量子纠缠的研究中,人们发现在多体系统中量子纠缠并不能自由地共享,这主要是由于量子纠缠具有单配性.另一方面,量子纠缠同样具有多配性,多配性是单配性的对偶性质,可理解为另一种纠缠限制.单配性与多配性
学位
李代数理论是十九世纪七十年代兴起的理论,自引入以来发展迅速,并已在许多数学领域得到应用,其中包括群论、组合学、微分方程和不变理论等。本学位论文主要的研究的是关于型李代数的迹方程及相关组合恒等式。在论文的第一部分,我们给出了一些论文研究需要用到的基础知识。这一部分主要介绍了本文中所涉及到李代数知识,主要包括李代数的概念,一般线性李代数及其子代数的内容,Killing型,Casimir元素及Weyl定
学位
为了研究三次Diophantine方程,Nagell引进了例外单位的定义:设R是一个含1交换环,如果u和1-u均为单位元,那么称u为R中的例外单位(exceptional unit),简称 exunit.2010年,Harrington和Jones对整数剩余类环Zn中的例外单位给出了计数公式.2015年,Sander研究了 2维例外单位空间的线性格点计数公式,杨全会等学者进一步研究了k维例外单位空
学位
深度强化学习目前已经取得了一定的成功。目前绝大部分深度强化学习算法针对一个任务,对其他任务的泛化性能差,而且训练需要长时间迭代,时间成本高,冷启动速度慢。迁移学习领域正好为这类问题提供了解决方案,迁移学习在分类模型中已有大量的研究成果,如何衡量源域和目标域的相似性是该领域的核心问题。针对上述问题,本文围绕如何利用基于MMD度量的迁移模型如何适用于强化学习场景展开深入研究,主要的工作内容如下:(1)
学位
多重假设检验是在一个错误控制准则下,同时进行多个假设检验的统计问题。它作为高维统计推断中的一种有效手段,广泛应用于各个领域,包括计量经济学、生物基因组学、文本类别分析、以及市场营销等。近二十年,错误发现率(False discovery rate,FDR)逐渐成为一种主流的错误控制准则,具有良好的检验功效。同时,基于FDR的检验方法方兴未艾,是数据科学的一个重要的研究领域。FDR衡量所有被拒绝的原
学位
现实世界不可避免地受到随机因素的影响,且外部噪声有时甚至起着决定性作用,可使相应的动力学发生根本性的改变。随机微分方程可以刻画此类不确定因素激励下的演化过程,对应的解的适定性、随机稳定性、随机分岔、随机混沌、不变测度都获得了一定原创性成果。本学位论文侧重研究加性噪声驱动的随机Lorenz-Stenflo系统在退化阻尼情形下的不变测度的存在性问题。具体如下:第一章,简述本学位论文的研究背景和国内外研
学位
清末岭南园林将宜居审美及营建传统结合在一起,在中国古典园林发展历程中占有极其重要的分量,是中国古典园林的典型代表。分析和研究园林建筑空间形态,可以为当下宜居环境建设提供借鉴,推动当代园林设计理论方法发展,帮助园林遗产修缮。然而,多数清末岭南园林早已衰败,仅留存部分遗址或少量图像,且园林建筑空间形态研究一般是通过人工分析。文章基于园林图像特别是少量图像的情形展开对园林建筑空间形态提取的研究,利用计算
学位
群论与组合设计理论之间相互联系,我们可以用群作用来研究组合设计的性质和分类.而人们对于拥有良好性质的设计的自同构群的研究特别关注,这些性质包括旗传递,点本原,区传递,区本原等.目前,对于对称设计的研究工作已近乎完善,对于非对称设计的研究也在陆续进行中.本文将继续讨论旗传递点本原非对称2-(v,k,λ)设计的分类问题.1987年,Davies证明了旗传递2-(v,k,1)设计,若自同构群的基柱是散在
学位
投资组合模型的研究起源于经典的均值—方差模型,收益和风险是衡量投资组合优劣的两个基本指标。在过去的研究中,风险被绝对地理解为是投资者所厌恶的指标,然而在现实金融市场中,许多风险偏好者可以利用某一行业证券的系统风险从而获得超额收益;另一方面,投资者会根据瞬息万变的市场情况实时地调整自身的投资组合,而政府则会对调整产生的超额收益进行征收资本利得税,从另一个角度上说,资本利得税影响着投资者对证券持有期限
学位