多标记分类学习研究 ——从标记独立到标记关联增强

来源 :天津大学 | 被引量 : 0次 | 上传用户:dimaie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真实世界中事物是复杂多样的,单一语义无法描述事物蕴含的丰富信息。为了描述事物丰富的语义信息,多标记学习应运而生并广泛应用在多种领域,例如文本分类、场景分析等。多标记分类学习的任务是学习一个模型,该模型为未知实例预测出一组相关标记。标记之间存在某种联系使得多标记学习难度高于多分类学习。为了使模型具有更高准确性和泛化能力,本文从标记独立和标记关联增强两方面对多标记分类展开研究,主要研究工作如下:(1)基于集成的标记独立的多标记分类方法。LIFT[1]是一个标记独立方法,该方法的不足在于训练阶段使用了可能会陷入局部极优和在高维数据上不稳定的k-means方法做聚类。本文提出采用集成的方法缓解上述问题从而使模型具有更高的准确性和泛化能力。具体地,该方法首先在训练阶段采用Bagging方法为每一个标记训练多个“好而不同”的分类器。其次,不同的分类器根据其自身损失自动求得权重。最终,在预测阶段,未知样本的最终结果由在多个分类器上的结果加权平均得到。实验结果表明集成后的标记独立分类方法有更好的性能。(2)基于标记独立和标记关联增强融合的多标记分类方法。本文提出一种标记关联增强的方法,并将其和标记独立方法相融合联合解决多标记分类问题。该方法以标记独立分类方法为基础,引入虚拟相关标记(与所有相关标记有关)和虚拟不相关标记(与部分难分不相关标记有关)并以标记排序的思想约束两个虚拟标记之间存在较大间隔从而实现相关标记和不相关标记的分离。实验结果表明该方法在准确性和泛化性上皆有提升。
其他文献
声振动信号是一种快速变化的微压信号,利用光纤声振动传感系统对声信号的检测和分析具有广阔的应用前景,因此,对高信号质量的光纤声振动传感器及高稳定性解调系统的研究具有重要意义。在传感器方面,本文针对目前膜片式光纤法珀声振动传感器振动膜片光反射率低、干涉强度低、信号对比度差等问题,设计了一种具有高反射率的聚苯硫醚薄膜镀金膜片,提高了干涉信号强度和信号对比度;在解调方面,提出了一种基于偏振双折射晶体的正交
光纤法珀传感技术以其解调精度高、动态解调范围大、抗电磁干扰等优点广泛应用于航空航天、深海探测和石油勘探等领域,随着应用的不断深入,对多个光纤法珀传感器进行同步解调的需求逐渐突显,然而传统多通道复用技术由于使用线阵CCD,在对多个通道的光纤法珀传感器进行同步解调时,为了区分各个通道的干涉信号,需要对系统光源的中心波长或者法珀传感器的腔长控制提出很高的要求,进而限制了其应用范围。本文针对上述问题,提出
制造业的蓬勃发展使得现阶段对数控机床加工精度提出了更高的要求。然而机床使用时间的增加和各零部件的老化、磨损等情况均会导致其加工精度的降低。为了维持和提高数控机床加工精度,亟需一种高效率、低成本的误差建模、检测与辨识方案。本文基于微小角度传感器和L型组合靶标阵列,提出一种三轴机床几何误差的新型辨识方案,完成的主要工作有:1、通过对比现阶段数控机床几何误差的数学建模与误差辨识方法,基于多体系统理论建立
随着机械制造业的快速发展,数控机床在模具制造、电子工程、汽车和航空航天等领域有着广泛的应用。由于具有通用性强、精度高、加工范围大等优点,数控机床已成为一种非常必要的设备。精度在数控机床中起着关键作用,目前也成为了加工自动化领域的一个热点问题。为了提高数控机床直行运动的精度,本文设计一种基于复合特征面阵列的测量系统,并基于该系统辨识机床直行运动过程中的几何误差,主要完成以下工作:1.分析了平面镜和旋
锈蚀是钢结构中一种普遍存在的缺陷。如果不及时采取锈蚀处理措施,可能会引发严重的安全事故并造成经济损失。人工视觉检查是目前最常用的结构锈蚀检测方法。该方法虽然操作简便,但是效率低、主观性强。基于计算机视觉的方法能够自动进行损伤检测,可以显著提高检测效率并给出客观地检测结果。传统的计算机视觉方法需要依赖先验知识设计特征,而深度学习算法能够自动从图像中提取出合适的特征。现有研究主要识别结构是否发生锈蚀,
目前建筑的运行能耗约为全社会商品用能的三分之一,是节能潜力最大的用能领域,也是节能工作的重点,北方城镇冬季集中供热占建筑能耗的21%,且目前管理粗放,难以满足按需供热的要求,集中供热工程势必将向着精细化的方向发展,这也对短期负荷预测的精度提出更高的要求。本文在对热负荷的影响因素及特点进行分析的基础上,结合各影响因素的重要性和可获得性确定了负荷预测模型的输入变量及预处理方法。以承德市某供热系统作为案
当前,我国冬季供暖能耗在社会总能耗中占比较大,供热节能势在必行。对供暖负荷的准确预测可以帮助运维人员提前掌握建筑的用能需求,进行精准调控,从而避免不必要的能源浪费。随着计量装置的普及以及人工智能技术的发展,机器学习技术在建筑物能耗预测方面得到了快速发展。本文以寒冷地区某住宅建筑为例,使用树模型与神经网络模型对供暖负荷进行短期预测与超短期预测,研究了两类在供暖负荷预测中的应用效果。本文首先利用相关性
"十四五"是国家电网公司迈向战略目标的关键五年。而供电所既是公司供电服务的最前沿,又是政策落地的最末端。落实"一体四翼"发展布局,提高供电所基础管理是必然要求。为解决供电所一线人员对上级政策理解不全面、业务流程不熟悉、服务要求落实不精准等一系列问题,国网山东省电力公司东营供电公司(以下简称"东营供电公司")创新搭建市、县、所贯通协同的"五点云讲堂"培训平台,以"上级政策一贯到底,基层需求及时
期刊
当前,基于卷积神经网络的深度学习技术在计算机视觉等多个领域取得极大成功,也是最具代表性、最有效的方法。但是深度学习技术严重依赖于标签准确且类别间数据平衡的大规模数据集。然而,大规模的标签准确的数据是极难获取的,同时真实世界的数据集大多存在类别间样本不平衡的问题。针对计算机视觉领域中的图像分类和人脸识别任务,如何有效利用标签噪声的数据或类别间不平衡的数据训练出理想的深度学习模型是一个亟待解决的难题。
机器学习和数据挖掘中多数数据类标签的缺失,使得聚类任务成为学习过程中的关键任务。聚类的最终目的是揭示数据的隐藏特性,因此对于聚类任务,得到合理的样本关系对的表示至关重要。而对于维度较高的数据的聚类任务,由于其数据密度低,较难从中得到有用的信息。目前常用的解决方法是无监督特征选择和子空间聚类。无监督学习任务中由于数据无类标签,无法直观得到样本关系,此时可通过构建图模型来表示,以挖掘数据信息,构建学习