基于流形对齐的半监督领域适配

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:starboyak
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机硬件的快速发展与数据规模的快速增长,机器学习与数据挖掘的理论取得了长足的发展,在工业领域也取得了巨大的成果.当数据量很小且无法获得更多的数据时,传统机器学习方法通常并不能取得理想的结果,而迁移学习就是解决这一问题的核心方法.迁移学习利用来自源域中有标签训练数据的知识来提高模型在目标域中的性能,其中目标域中几乎没有标记的目标训练数据.目前,大多数迁移学习方法假设源域和目标域由相同的特征空间构成,这大大限制了它们的应用.近年来,针对这种局限性,研究者提出了异构迁移学习方法,这也是目前迁移学习领域的研究热点.在异构迁移学习中,源域和目标域之间的特征空间是不等价的,并且通常是不重叠的.大多数异构迁移学习方法都是进行变换特征空间,变换方案分对称变换和非对称变换.不论是对称变换还是非对称变换,现有的异构迁移学习方法都存在着优化目标为非凸、构造的公共子空间丢失信息、领域适配信息损失等问题.针对上述问题,本文提出一种基于流形对齐的半监督领域适配方法.该方法利用半监督流形对齐,在保持数据信息的前提下找到源域和目标域的最优公共子空间,然后利用结构风险最小化原理,加入正则项避免过拟合,最后将联合动态分布适配问题转化为一个凸优化问题,通过求解凸优化问题找到最优分类器.在该方法中,流形对齐能够改善在构造公共子空间时丢失信息的问题;联合动态分布适配能够减少领域适配过程中的信息损失;最后的优化问题为凸优化问题,保证了计算结果为全局最小值.在多个数据集上的实验表明,该方法具有更好的性能,并且能有效解决其他现有方法存在的问题.此外,本文还给出了该模型误差的泛化上界,证明了模型的稳定性.
其他文献
习近平生态文明思想依据马克思主义基本原理,深刻把握社会发展规律,聚焦中国生态文明建设实际,以人民群众对美好生活的向往为导向,运用科学的方法解决人与自然之间的矛盾,蕴含着丰富的辩证思维,为“美丽中国”建设和新时代中国特色社会主义建设事业发展提供了方法论指导。习近平生态文明思想的辩证思维是历史继承性和创新性的综合体现。马克思恩格斯人与自然的异化与扬弃和人-自然-社会相统一等思想、中国化马克思主义生态哲
高校田径运动会是学生群体活动的重要内容之一,是展现大学生精神面貌,激发大学生参与体育锻炼的一项重要举措,对促进学生运动技术水平提高、丰富校园体育文化起到一定的积极作用。为此,本文立足现有国内外研究基础上选取辽宁省具有代表性十所高校的部分学生、教师以及该领域专家作为调查对象分析影响辽宁省高校田径运动会开展满意度的主要原因。(1)政策扶持力度较低是目前影响辽宁省高校田径运动会开展满意度的主要问题,限制
β-Ga_2O_3作为一种新型宽禁带半导体材料,因其~4.8 e V的禁带宽度、高达8MV/cm的击穿场强、稳定的物理化学特性,成为了Si C、Ga N之后功率半导体材料的研究热点。当前β-Ga_2O_3材料和器件的研究发展态势非常迅速,取得了一系列的研究成果。然而,β-Ga_2O_3材料本身非常低的热导率将导致其功率器件产生非常严重的自热效应,成为了其未来应用的一大障碍。解决这一问题的有效思路是
心理健康疾病严重威胁着人类的身体健康。对此,世界卫生组织和各国政府高度重视心理健康疾病的预防与治疗,并且纷纷采取有效的措施来预防、治疗心理健康疾病。由斯普林格出版社在2018年发布的《农村学校心理健康手册》一书对美国农村学校心理健康疾病的临床表现、疾病诊断、预防与治疗作了详细叙述,是一本关于心理健康的科技文本,其内容客观、严谨、准确。美国在心理健康疾病研究方面有着丰富的经验,并取得显著效果,因此学
目的为了研究乳腺癌患者基线水平的血清氨基酸和患者发生急性化疗导致的恶心呕吐(chemotherapy-induced nausea and vomiting,CINV)之间的相关性,探讨化疗前基线的血清氨基酸水平作为乳腺癌患者急性CINV风险预测标记物的可行性。方法通过病例回顾研究方法,基于锦州医科大学附属第一医院电子病历系统选取2017年8月-2019年8月早期乳腺癌术后首次接受术后辅助化疗并使
随着信息时代的到来,信息技术正在突飞猛进的发展,伴随而来的是海量数据的产生。不仅是数据数量的增加,同时数据所包含的特征与维度也在持续的增加。数据量越大、维度越高,能够影响到信息的冗余和噪声也就会越多。实际上,往往对于某一串高维数据而言,只有少数甚至极少数的特征是有价值的,绝大多数的特征可以被忽略。为此,很有必要在使用数据前对高维数据进行简化和去噪,抽离出其中的小部分有价值的数据特征,这个过程通常被
随着老年化社会的进展,老年患者中风后偏瘫的数量逐年增加,及早地进行中风后康复训练辅助动能运动的重建引起人们越来越多的重视。上肢运动功能与人体日常的生活息息相关,其
番荔素是从番荔枝科植物不同部位中分离得到的一系列含四氢呋喃环的长碳链脂肪内酯类化合物组成的有效部位,具有很强的抗肿瘤活性,却难溶于水,同时具有较强的毒副作用。本研
作为第五代移动通信的重要应用场景之一,海量机器类型通信(massive Machine Type Communication,mMTC)受到了广泛关注。为了解决mMTC网络拥塞、设备电池能量受限等问题,现有mMTC网络多采用分簇架构。然而不断增长的设备数目与日益紧缺的频谱资源之间的矛盾愈发突出,因此本文以提升mMTC网络的频谱资源利用率和网络生存时间为目标,研究了资源复用场景下分簇方法设计中的簇数
超声成像技术广泛应用于医疗诊断领域,随着临床诊断对便携化设备需求的日益迫切,更高性能的集成超声信号处理电路逐渐成为研究热点。模拟前端(Analog Front End,AFE)作为集成成像系统中处理超声换能器输出信号的第一级,其性能对整个系统有举足轻重的影响。本文设计的高频超声成像模拟前端包含八个通道,每通道由四个模块构成:低噪声放大器(Low Noise Amplifier,LNA)、电压控制衰