结合低秩和图嵌入技术的域适应方法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:hdu07095238
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的机器学习算法学习能力强、自适应能力强,通常需要满足两个条件:一是要有大量的标签数据,二是需要训练和测试数据具有相同的概率分布。然而,在大多数实际应用中,上述两个条件是很难满足的。为了突破传统机器学习算法的瓶颈,越来越多的研究者们开始关注域适应算法,希望利用有标签的源域数据去学习无标签的目标域数据,同时源域和目标域有着不同且相关的分布。大量的域适应算法被证明域适应可以很好地解决不同域下的知识迁移问题,同时域适应已经广泛应用于图像识别、文本分类、情感分析等问题。当前大多数的域适应方法通常分为特征匹配和实例重加权两种方法。特征匹配方法希望学习一种新的特征表示来减少域间的数据分布差异,实例重加权方法则是根据源实例与目标实例的相关性对数据进行权重调整,从而减少分布差异。同时,还有一些域适应方法通过结合这两种方法提出了联合优化方法,希望更进一步减少域差异。然而,这些域适应方法一味地减少域差异,却忽略了数据的内在结构以及数据间的相关性。尽管当前也有大量的域适应方法专注于数据属性的保护,但是却又忽略了域间差异,导致算法效果并不显著。因此,本论文将提出新的域适应方法,以此解决数据分布对齐和数据信息保护两者难以同时优化的问题。为了更好地保护数据的多种信息,本论文主要专注于低秩技术和图嵌入技术两方面,分别对两种技术进行研究。低秩性可以保护数据的主要属性,譬如源数据中有辨别能力的数据信息以及目标数据的主要属性,图嵌入可以保护数据关系。通过结合低秩技术和图嵌入技术,新的域适应方法在对齐分布的同时,也将大大增强对不同的数据信息的保护程度。值得注意的是,本论文在多个标准的数据集上进行了大量的实验,实验结果证明,与当前大量的域适应算法相比,结合低秩和图嵌入技术的域适应方法有显著的优越性。除此之外,本文将所提的域适应方法应用到在线数据流分类,并且提出了一种跨域数据流分类模型。实验证明该模型可以解决当前数据流分类算法无法解决数据分布差异的问题。
其他文献
紫杉醇是一种广泛使用的癌症化疗药物,而巴卡亭III是紫杉醇生物合成途径中的重要前体,其生产成本的下降有望降低紫杉醇的价格和满足其市场需求。针对生物合成途径中生成巴卡
现有的世界格局及国际治理规则越来越难以满足经济体深入发展的需求,对于发展中经济体来说,虽然对全球经济发展做出了卓越贡献,但从全球化中得到的收益与贡献并不匹配。而在发达国家中,也出现了逆全球化现象。在世界格局发生大变革的时代,各国更应加强国际合作,推动建立更加均衡的发展模式和制定更加公平合理的国际规则。金砖国家金融合作体现了中国始终践行互利共赢的合作理念,直面世界金融体系的变革与挑战。首先,本文运用
随着我国对新能源行业的大力扶持,水力发电行业在近年内飞速发展,水轮发电机装机容量越来越大,在整个电力系统中所占的比例也是越来越高。水轮发电机作为电力系统的核心组成部分,它的安全运行就显得尤为的重要。而作为水轮发电机核心组成部分的转子是非常有研究价值的。本文首先介绍了现阶段水轮发电机转子测温的发展情况,分析、比较了水轮发电机转子温度检测方法,得出结论:直接测温所带来的误差大于间接测温,且检测软、硬件
四旋翼无人机由于其体积小、结构简单、用途广泛,开始逐渐融入到大众生活中,并且逐步成为无人机领域关注和研究的重点。尤其是在无人机探索未知领域方面,无人机有越来越多的应用,例如四旋翼飞行器可以携带摄像头和激光雷达,方便的到达指定地点,进行目标探测。并且,无人机有其自身的优势,例如机械结构和控制理论简单、制造成本低等特点,有利于无人机在各个领域的推广。本文主要内容是设计完成飞行器控制方法、路径规划以及障
鲢(Hypophthalmichthys molitrix)作为我国著名的“四大家鱼”之一,在我国水产养殖历史悠久,是我国淡水经济养殖鱼类中重要的品种,广泛分布于我国各大水系。近年来,由于大规模的水利水电工程的修建、生态环境的破坏、长期的过度捕捞、近亲繁殖和不科学的增殖放流,导致我国野生鲢渔业资源和种质资源严重下降。因此,对提供人工养殖和增殖放流的原种场鲢亲本与苗种的遗传多样性研究显得十分重要。本
近年来,城市滨河空间因其独特的景观资源在城市生态规划领域受到关注,同时为城市的形象塑造提供了良好支持。然而在实际发展中,滨河土壤污染、生态环境破坏等相关问题逐渐显现。城市滨河地带土壤重金属污染对河水水质危害性极大,为城市用水带来安全隐患。滨河地带土壤重金属污染风险评价能够有效地预防水体重金属污染,并为污染水体的治理和修复提供理论支持。本研究对南水北调中线工程焦作段滨河地带进行土壤重金属污染风险评估
随着我国国民经济快速、稳步发展,港口集装箱堆场企业对信息的实时处理能力要求越来越高。特别是危化品行业的安全形势日益严峻,对危险品集装箱堆场企业的堆场管理的安全性、准确性、实时性要求也越来越高。D公司作为一个于2013年因危险品特性而建立起来的功能性堆场,也需要适应于国家政策与行业特点进行改革、创新。D公司若想有效反应危险品集装箱的实时状态、提高企业的安全管理的应急与联动能力、提供实时的客户服务必须
中国经济蓬勃发展,能源需求在多个地方逐渐增加。能量开采后需要长距离运输,为了节省运输成本并确保能源供应的可持续性,除了传统的运输方式公路、铁路和水路之外,长距离管线运输现在已经得到了广泛的发展,输送液体的管道的效率已经为社会所认可。国内管线铺设长度较大,跨越区域较多,因此管道要通过不同地质情况。地貌类型多样,地形高差巨大,地质环境复杂,雨量充沛,埋地管道沿线极有可能发生地质灾害,威胁管道的安全运行
尼古丁(1-methyl-2-[3-pyridyl-pyrrolidine])是一种存在于茄科植物中的生物碱,也是一种有毒的杂环化合物,对人体、动物和环境危害严重。由于其化学结构稳定、不易自然降解,利用微生物降解尼古丁是效率高、成本低且对环境友好的方法。本实验室前期从湖北省襄阳市烟草种植地土壤中分离筛选了一株具有较高尼古丁降解能力的菌株,经菌种鉴定为根癌土壤杆菌,命名为SCUEC1菌株。本研究对根
随着印染行业的迅猛发展,染色技术也在不断提升,而传统的聚酯纤维染色技术在实际应用过程中都存在着各种各样的弊端和问题,使其难于在工业生产中广泛应用。为针对性解决传统聚酯纤维染色所存在的问题,实现聚酯纤维的绿色印染,通过从聚酯纤维和分散染料的分子结构入手,设计合成了一种温控型咪唑离子液体。在本论文中,其主要研究内容分为两部分,一是离子液体前驱体和离子液体的设计,二是离子液体的合成。离子液体的设计中,选