弱标记条件下的多标签主动学习分类方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:liliqqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习中,传统的监督学习框架是一种为未标记样本预测唯一类别标签的机器学习框架。在该框架下,每一个待学习对象都具有唯一的类别标签,目前该框架已经取得了很大的成功。然而,对象多义性问题是现实生活中无法回避的问题,多标签分类模型是一种针对现实生活中对象多义性问题而提出的机器学习模型。在多标签学习模型框架下,每一个已标记的样本由若干个不同的标签来表征,学习的目标通过对已标记多标签样本的学习,为未标记样本分配所有合适的类别标签。多标签学习的研究对于对象多义性学习建模具有十分重要的意义,是目前机器学习界的研究热点之一。本文在深入地研究多标签学习框架的基础上,将主动学习的思想引入多标签学习的过程中,在考虑标签间依赖关系的基础上,针对多标签学习过程中所面临的弱标记问题进行了深入的研究,提出了一种弱标记条件下的多标签主动学习框架。本文的主要研究工作如下:(1)研究和分析现有的面向多标签分类的主动学习采样策略。针对多标签主动学习领域的几类方法进行总结和分析,为后续的研究提供理论依据。(2)针对弱标记问题,提出了一种基于标签间条件依赖关系的多标签主动学习框架模型,在保证多标签学习模型泛化性能的前提下,尽可能降低人工标记的代价。(3)在已取得的研究成果的基础上,进一步将半监督学习机制引入主动学习过程中,用于提升和促进多标签主动学习框架的效率和性能。本文对提出的方法均进行了有效的实验验证,并对实验数据和结果进行了分析,以验证本文所提出的方法的科学性和有效性。
其他文献
制造业是国家的支柱性产业,是实体经济发展的关键。中国多次在会议上提出要加强建设新时代制造强国,加快发展先进制造业,支持传统产业优化升级。但是中国制造业目前的器械设备的大部分技术依靠从国外引进,原创性产品和技术极少,企业又不能很好的处理引进和自主创新之间的关系,缺乏创新型人才,创新行为还是只停留在模仿阶段。对制造业企业而言,如果想要获得可持续的发展优势,必须要将更多的资金投入到创新活动中去,要不断提
综合教材课后写作练习的目标是在密切联系课文的基础上训练写作能力,同时兼顾其他语言技能的训练。它与写作教材的写作练习之间既有联系又有区别。本文以《发展汉语(第二版)》初、中综合教材课后写作练习作为研究对象,使用文献研究法、定量研究法和调查法等对写作题型和写作训练要素进行考察。本文对写作题型的研究分为设计与分布两个方面,通过考察发现写作练习题型比较多样,但分布不均衡;题型的任务复杂度整体上遵循循序渐进
结构健康监测系统通过对系统采集的特征信息的分析,判断结构当前的状态,常应用于建筑结构、机械工程领域中。其中,结构损伤识别系统是结构健康监测系统中核心的组成部分。利用人工神经网络实现结构的损伤识别,可以快速高效的对传感器采集的信息进行处理、分析,且伴随着相关技术的发展,有望实现对结构状态进行实时在线监测的目的。结合信息融合技术,基于人工神经网络的结构损伤识别系统能在噪声环境下,从大量、复杂的监测数据
人脸识别技术是计算机视觉领域的典型应用之一。伴随着深度学习特别是卷积神经网络的发展,人脸识别技术在静态图像的识别方面已经取得突飞猛进的进步,然而动态图像人脸识别和视频流的人脸识别依然面临着很多困难,被检测到的人脸往往会受到拍摄角度、位置、光照、低分辨率图像等多因素的影响,给后续的人脸识别带来极大的困难。动态的人脸识别技术在安防监控、侦查破案、智慧城市等领域应用广泛,因此具有很高的研究价值。针对以上
传统的不可再生能源的大量消耗以及CO_2排放量的迅速增长导致能源危机和全球变暖等问题日益加剧。因此,发展经济、环保的碳中和策略对人类社会至关重要。其中,CO_2电还原技术和H_2/O_2燃料电池在绿色能源发展方面非常有前景。但其限制因素主要是:要完成阴极的CO_2或O_2还原反应比较困难,因为反应中涉及到多个电子转移,且反应动力学缓慢,需要稳定高效的电催化剂来促进反应进行。所以,设计与研发高效、稳
太阳光在通过大气层时,受到各种气体分子和气溶胶粒子的散射作用,改变了光的偏振特性,形成相对稳定的大气偏振信息分布规律,即大气偏振模式。偏振光仿生导航是一种以大气偏振作为信息源的自主导航方式,具有较好的实时性及抗干扰能力。大气偏振中性点是描述大气偏振模式的重要参量,是实现偏振光仿生导航的关键要素之一。本文以大气偏振模式的获取方式为出发点,针对现阶段大气偏振模式探测设备结构比较复杂,成本较高等缺点,提
近些年来,遥感传感器的种类逐渐丰富,这使得从不同的传感器中获取到多种多样的数据成为了可能,如高光谱图像(Hyperspectral Image,HSI),激光雷达数据(Light Detection And Ranging,Li DAR),不同类型传感器得到的数据的优点和缺点各不相同,高光谱数据由同一场景的多个光谱通道组成,波段已经可以达到几十或者上百个,含有场景丰富的光谱信息和空间信息,而激光雷
近年来,国家高度重视生态文明建设和绿色发展。面对巨大的绿色融资需求,需要大力发展绿色金融,吸引更多社会资本流向绿色产业,从而推动经济绿色转型与高质量发展。金融企业作为市场竞争主体,在开展绿色金融业务时需要兼顾商业性和公益性。如何实现绿色金融的商业可持续性是金融企业重点关注的问题。因此,本文选取承接广州市花都区绿色金融改革创新试验区建设的核心企业和重要载体——广东绿色金投公司探索绿色金融商业可持续性
耕地是指可以进行种植农作物的土地,是人类生存和可持续发展的基础。但在城市快速发展,建设用地急速扩张的大背景下,耕地资源遭受到了大量破坏,违法占用耕地搞建设、挖沙、取土等破坏耕地行为屡见不鲜。自1997年耕地破坏罪的提出开始,国家陆续出台制止耕地破坏的相关政策法规,对破坏耕地行为进行程度鉴定,依法移送定罪量刑。但耕地破坏行为没有得到有效制止,究其原是因为没有一套完备的耕地破坏程度鉴定标准。因此研究适
灰色市场简称灰市,是指未经品牌商(制造商)授权,私自销售该品牌产品的一种“非正规”销售渠道。其中,灰市产品是由品牌商生产或制造商代工生产的附有正确商标的真品,价格相对低廉但缺乏相应的售后服务,其销售渠道游离于国家有关部门监管之外。在现实生活中,灰市已经成为一种常见的经济现象,而且灰市产品涉及的行业众多且规模庞大。我国由于市场规模巨大,灰市在国内市场依然存在而且活跃。灰市产品流入市场会加剧同类产品竞