面向弱标签的多示例迁移学习方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:HUANming520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多示例学习是一种新的学习框架,在机器学习领域引起了越来越多的关注。在多示例学习中,训练集由一组多示例包组成,而一个多示例包含有若干个示例。如果多示例包中至少存在一个正示例,那么该多示例包为正包,否则,该多示例包为负包。多示例学习面临以下两个方面的挑战:1)在标注多示例包的时候,不同的专家可能对同一个多示例包给出不同的分类标签。当一个多示例包对应多个不一致的、不统一的分类标签(称之为“弱标签”),而真实分类标签未知时,如何建立多示例学习分类器;2)当目标任务的多示例包的数量比较少时,如何利用相关的分类任务来提高目标任务的模型精度。对于多示例学习所面临的挑战,本文提出了一种基于弱标签的多示例迁移学习模型。一方面,针对多示例学习中的弱标签问题,我们赋予每一个弱标签一个权重,并使用带权重的弱标签来表示多示例包的标签,建立面向弱标签的多示例学习分类模型。另一方面,针对目标任务的多示例包的数量比较少的问题,我们把目标任务相关的任务(“源任务”)引入学习过程,在上述的弱标签分类模型基础上,融合目标任务和源任务的信息,建立基于弱标签的多示例迁移学习模型,实现源任务到目标任务的知识迁移。为了求解该模型,首先,通过随机或者相等地方式来初始化弱标签权重,利用带权重的弱标签之和来表示多示例包的标签。其次,在多示例包标签基础上,求解多示例迁移学习分类器。再次,根据分类器结果,更新弱标签的权重。最后,通过交互迭代的方式来更新分类器和弱标签的权重,直到算法收敛,得出最终分类模型。本文在五个真实数据集上进行实验,通过与现有的多示例学习方法进行比较,验证基于弱标签的多示例迁移学习方法的有效性。实验结果表明,本文所提出的方法的在分类精度和AUC(Area Under the Curve)这两个评估指标上,优于现有的多示例学习方法。
其他文献
沙柳作为我国西北部沙漠地区的能源植物,其细小枝条等是发展生物质成型燃料可依赖的重要原料资源,由于沙柳细枝具有贮存不便、运输成本高等缺点,该类资源大部分被直接燃烧或者浪费掉,因此,对沙柳细枝进行致密加工处理是目前首要工作。本文分析了沙柳颗粒致密成型过程中压力的传递机理和规律,详细研究了力链的演变机制,旨在进一步分析散粒体压缩过程中外载荷的传递路径,加深对沙柳颗粒致密成型过程的认识,为生物质的推广提供
研究生教育肩负着培养创新型人才与发展创新科学技术的重要使命,是建设高等教育强国的重要组成部分,也是引领“双一流”建设向纵深发展的关键因素。当前,随着我国研究生教育
本文以攀枝花至大理高速公路(四川境)项目宝鼎2号隧道为例,针对隧道穿越三叠系大荞地组煤系地层段实体煤、断层构造带和采空区等复杂地质条件,采用分析、模拟、试验、考察等方法对隧道突出危险性进行了研究,在现行《铁规》的基础上提出了适应公路隧道的递进式预测技术。同时引入高压水力割缝增透技术作为隧道穿越突出煤层灾害治理关键技术,采用数值模拟对比分析其抽采效果,并将该技术用于实践,取得了良好的应用效果。主要成
随着现代工业的快速发展,大量性能更为优良的薄壁叶片类零件被应用在各种工业领域中。此类零件表面质量的好坏往往会对其工作性能及寿命产生较大影响,其中中小型薄壁叶片类零
目的:探讨脂质蓄积指数(LAP)与代谢综合征、糖尿病、心脑血管疾病发病的关系。方法:本研究基线调查以2009-2012年,浙江省代谢综合征调查数据为基线资料,内容包括流行病学问卷调查、体格检查和常见生化检查。研究对象为22649名18岁及以上常住居民。第一部分利用浙江省慢性病监测信息管理系统和记录连结方法,获取各个研究对象从基线调查到2018年期间糖尿病、心脑血管疾病发病信息,排除基线资料生化资料
目的对比边支斑块主动转移(Active Transfer of Plaque,ATP)技术与拘禁球囊技术(Jailed balloon technique,JBT)在治疗冠状动脉非左主干分叉病变中的临床应用疗效。方法将2017年3月-2018年3月在内蒙古自治区人民医院心血管内科接受治疗,进行冠状动脉造影术,术后确诊为冠状动脉非左主干分叉病变,且边支血管直径<2.5mm同意行经皮冠状动脉介入
目的:FGF21是一种参与代谢调节的细胞因子。DsbA-L是一种与脂联素多聚体形成有关的重要调节蛋白,两者在增加胰岛素的敏感性和增加能量代谢方面具有很多有益的作用。最近研究
随着工业化的进步,能源成为社会发展不可或缺的一部分,然而石油等不可再生资源越来越少且环境污染大,因此可再生新能源的研究工作成为现代发展的重点之一。丁醇具有辛烷值高
边缘检测在图像处理中占据着不容忽视的重要位置,在生产、生活中的诸多方面应用广泛,例如机械部件的故障检测、医学影像分析及模式识别等。但图像在获取以及存储的过程中非常
氮化铝(AlN)是一种重要的Ⅲ-Ⅴ族化合物半导体薄膜材料,广泛应用于制备高亮度LED、紫外探测器和高频大功率器件。金属有机气相化学沉积(MOCVD)是生长AlN最常用的方法。在AlN的MOC