基于特征分布差异自适应的无监督迁移学习方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:dingz450519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展,人们的日常生产和生活产生了大量的数据。最近,由于移动互联网的产生和发展,数据产生的速度越来越快,数据量也随着激增。传统机器学习假设训练数据和测试数据服从相同的统计概率分布,然而现实中的数据往往来自不同概率分布的数据集,这将导致学习性能下降。如何从不同概率分布的数据集中挖掘有价值的信息已经成为机器学习的研究热点问题。迁移学习打破了训练数据与测试数据同分布的假设,因此测试数据可以借助不同概率分布的训练数据进行知识迁移,从而提高测试数据的学习性能。目前迁移学习中的联合分布对齐方法主要通过同时减小边缘分布差异和条件分布差异来实现域适应。然而这类方法分配给边缘分布差异和条件分布差异相同的权重,这与实际场景不符。另外,分布对齐方法假设独立分布差异存在或者联合分布差异存在,不能根据具体任务自适应特征分布差异对齐导致学习性能降低。因此,本文针对这两个问题,提出基于类内距离约束的特征分布差异自适应方法以及两阶段特征分布差异自适应框架。本文的主要工作和创新点在于:针对目前联合分布对齐方法通过同时减小边缘分布差异和条件分布差异来实现域适应,然而忽略边缘分布差异与条件分布差异根据不同的任务具有不同重要性的问题,提出了基于类内距离约束的特征分布差异自适应方法。该方法首先通过平衡分布因子给边缘分布差异与条件分布差异分配不同的权重,然后在每次迭代中动态更新平衡分布因子。此外,在域适应过程中同时加入源领域的类内距离约束和目标领域的类内距离约束,加强类的可分性。在多个数据集上的实验结果表明所提出的方法能有效地提高迁移学习的分类准确率。针对目前分布对齐方法假设域间边缘分布差异或者条件分布差异独立存在以及假设域间边缘分布差异和条件分布差异同时存在导致学习性能下降的问题,提出了两阶段特征分布差异自适应框架。该方法在第一阶段,快速评估边缘分布差异的大小;然后,在第二阶段,如果边缘分布差异较小,则只适配条件分布差异;如果边缘分布差异较大,则同时适配边缘分布差异和条件分布差异。为验证该框架的有效性,本文在第二阶段结合基于类内距离约束的特征分布差异自适应方法适配联合分布差异。同时,本文在多个数据集上的实验表明本文所提出的T-BDA框架能实现独立分布差异对齐和联合分布差异对齐自适应,提高跨领域分类准确率。
其他文献
以使用者的角度,从空间利用率、景观设施完善度和活动环境等方面对修业广场进行了研究,指出了修业广场的优缺点,达到了为今后校园广场的设计提供科学依据的目的。
<正>KBR公司于2010年6月4日宣布,签署了一项合同,将为吉林康奈尔化学工业股份有限公司在吉林省吉林市新建苯胺装置提供技术转让。通过与杜邦公司组建技术转让许可联盟,KBR公
<正>大数据和智能制造给传统工业带来了巨大冲击,强大的工业数据分析服务将成为制造企业数字化战略的重要组成部分,工业物联网将显现出更大的战略价值。2014年,三一集团启动
<正>作为中国页岩气勘探开发"主战场"的重庆,近日出台了页岩气产业发展规划,预计到2020年,将建成页岩气产能300×108m3,产量有望达到200×108m3,并将在勘探开发、管网建设、
<正>随着社会的快速进步和时代的发展,在平等、自由的价值导向下,女性不再只是"下得厨房、入得厅堂"的贤惠媳妇,而拥有了相对公平、平等的职业发展平台,越来越多的女性踏入职
一个民族生命力往往体现在新生一代身上,广大青少年体格强健、人格健全、精力饱满和思想进步是一个社会文明进步的标志,同样也是我们国家综合实力的重要方面。个体锻炼态度直
近年来,跨文化意识的培养已日益成为外语教学的重要指导思想之一,而外语教学作为异质文化导入的重要手段,其本身又是一种跨文化交际活动。因此,跨文化差异势必会对外语教学的方方
食用蕈菌味道鲜美,营养价值丰富,开发和利用野生食用蕈菌资源,对丰富野生食用蕈菌种质资源库意义重大,是蕈菌产业发展的关键。本课题运用形态学观察结合内转录间隔区(Internal
长期以来,因受传统教学模式的影响,在我国大学英语教学中,教师往往忽视教学中的文化内容和学生文化认知能力的培养。教师应将外语教学和文化意识联系起来,反思传统的外语科研
上海市高一地理第一册内容主要是自然地理部分的知识。在教学过程中学生普遍感到自然地理知识的难度较大,内容抽象,不好理解,进而学习兴趣不高。面对这样的情况,采取针对性的措施