开放场景下的鲁棒半监督学习算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:sqlservermaintenance
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器学习在诸多现实任务中取得了成功应用,其中一个关键要素在于模型的构建拥有充分的标记数据。然而,现实场景下,标记数据的获取通常代价高昂,亟需要能够有效减少标记代价的机器学习框架,半监督学习就是其中的一类主流范式。经过十余年的研究,半监督学习在封闭场景下取得了显著进展。然而,其在面临开放场景时,效果大打折扣,亟待研究能够有效应对开放场景的学习算法。具体而言,1)在开放场景下,类别集合不再固定,新类数据不断涌现,需要有效检测和利用;2)在开放场景下,数据关系不再可靠,复杂异构图数据不断涌现,需要有效过滤和利用。本论文针对开放场景的半监督学习下上述两个难点问题进行研究,取得如下新进展。1.针对类别集合不再固定的动态数据流半监督学习任务,提出了高效鲁棒算法Seen,该算法有效地融合三个子模块:基于随机森林的新类检测器SeenForest,基于标记传播算法的已知类分类器Seen LP和它们的协同更新过程。该算法利用了有限的标注数据和大量的无标注数据,能够自适应地应对不断变化的新类数据流。在四个基准数据集上的实验验证了该算法不仅能对已知类数据做出有效预测,也能精准识别出数据流中的不同新类数据,在各类数据上均有良好表现。2.针对数据关系不再可靠的复杂异构图半监督学习任务,提出了新型图神经网络算法HmGnn。该算法通过生成超点将零散割裂的众多微图串联以便全局共享信息,进而设计了基于注意力机制的异构卷积算法以更有效地学习节点的表示,并从理论上分析了此建图方式的合理性。结合爱奇艺平台的真实数据,本文将HmGnn和主流监督学习方法以及流行的图神经网络方法进行了对比,实验结果表明该算法取得了明显的性能提升,并具备更好的鲁棒性。
其他文献
现代木构建筑有着节能低碳的环境保护意义,很多国家鼓励以现代木构技术建造建筑。对于现代木构技术下的外围护结构,人们对材料的选择更多样,对围护体性能需求的了解更精确,对构造的处理更科学。本文是基于南大建构课构造教材《建构设计——材料·构造·结构》的专题研究。即是基于教材中材料-木材部分,研究现代木构建筑的外围护结构的构造与表达。意在通过对材料-问题-案例的学习,总结基于材料特性和现代木围护结构性能需求
大数据时代的到来不仅带来数据规模膨胀与语义复杂化的问题,还将半结构化数据以及非结构化数据的处理问题带到台前。与此同时,金融行业的快速信息化推动了将XBRL文档也纳入开放数据体系的研究步伐,相关研究也逐步从理论探索走向了场景应用。作为半结构化数据的代表,XBRL文档实时地提取和挖掘需求对数据提出了两个要求:既需要XBRL文档具有较高的语义性,又需要一套能够大规模处理XBRL实例文档的框架。这两个要求
众包测试是一种以众包方式进行的软件测试活动,由需求方、工人方和平台方三方共同参与并协同合作,凭借用户广泛与反馈快速等特点以实现测试能力与效率方面的提升。在众包测试中,为了吸引更多工人报名参与任务,同时也为了鼓励工人提高测试质量从而更好地完成任务,平台常常会对工人方进行激励。然而,现有众测平台的激励主要存在着两大问题:一是当前平台常见的激励机制往往效果有限,劳动力评估方式不科学或是分配方式不公平,导
【目的】1.探讨ICU护士心理健康、工作压力、工作环境的现况及相关性,明晰工作压力与工作环境对护士心理健康的影响,了解ICU护理人员的心理健康状况及对EAP的需求,进行EAP服务需求评估。2.利用ROC曲线确定ICU护士预警指标及其分界值,探寻简便、快捷的护士心理预警工具,为护士心理异常早期识别提供依据。3.根据调查及需求评估结果设计EAP的实施方案,为医院实施EAP工作提供全过程实践操作指引。【
我国是少数气象灾害很严重的国家之一,应急物流又是贯穿气象灾害应急管理的关键环节,但因现有应急物流系统的不健全,本可以避免或减轻的损失出现并扩大,而应急物流系统能否有效作用于区域,关键在于其系统是否具有强大抗逆力,强大的抗逆力离不开其利益相关者的参与,它们之间融洽协调的关系有助于系统整体提升。提升抗逆力的最终目标是切实有效降低气象灾损,综合考虑应急物流系统抗逆力与气象灾害系统的关系也不可忽视。同时,
现代光学中,基于几何相位的平面光学元件拥有集成度高和体积小等特性,同时单个元件可以调控多维光学参数,因此其受到研究人员广泛关注,可以用于光场调控、全息成像、光束偏折以及光学阵列产成等领域。几何相位是因偏振态改变导致的相位,依赖于偏振态的演化路径,所以一般是由非均匀的各向异性材料产生。液晶几何相位元件是当前研究的热点,因其光电可调特性被广泛的应用于成像、光通讯、特种光束等领域。然而,一般向列相液晶几
近些年,随着经济的快速发展和人口的快速增加,产业集群效应也随之加深。物流活动的重要内容之一已经逐渐变成了如何实用新流程和新技术来实现社会的全方面可持续发展。绿色物流概念应运而生。电动汽车(Electric Vehicle)是由新能源驱动的低污染交通工具,在政府出台的各项政策的扶持以及公众环境保护意识的增强下,在社会中越来越广泛使用。电动汽车在节能和环保方面优于传统车辆,巨大的潜在利益已经引起了社会
层状过渡金属硫属化合物因其独特的电子结构,具有丰富的物理性质。其中,过渡金属五碲化物ZrTe5和HfTe5晶体由于具有较大的塞贝克系数和电导率在热电领域具有潜在的应用,但是其热导率偏高,限制了热电性能的进一步提升,有待进一步优化热导率。此外,理论预言ZrTe5和HfTe5是拓扑绝缘体材料,同时具有异常的电阻温度依赖关系,分别在150 K和80 K附近表现出金属-绝缘体转变现象,这些特殊输运性质的起
自20世纪开始,中国的乡村经历了一系列重大的改革和变化,从最初的乡村精英自治到全面的国家规范治理,乡村各方面建设得到了质的飞跃,村民的生活模式也随之发生了巨大的转换。公共空间演化自公共生活,特定的生活方式塑造特定的公共空间。桐庐县旧县村文化礼堂是笔者在研究生期间跟随导师张雷教授实习参与的实际项目,以此为契机,笔者对桐庐县已建成的农村文化礼堂进行调查研究,总结建设现状并发现了三个基本问题:公共空间组
世界范围内各种有机染料对自然水域的污染已成为人类急需解决的突出环境问题之一。任何一种单独的染料废水处理方法均存在一定的局限性。吸附-光催化联用技术具有去除效率高、环境友好、能耗低等优点,在高效去除水溶液中染料污染物方面具有广阔的应用前景。因此,开发具有优异吸附效率和光催化性能的复合材料至关重要。在众多的碳材料中,生物炭以其价格低廉、比表面积大、表面官能团丰富、吸附能力强等优势成为潜在的吸附-光催化