基于辅助信息学习的监督分类方法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:guicailea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是人工智能领域中非常重要的基础理论和技术方法,近些年受到了空前的关注,目前已经在计算机图像处理、生物安防、智能医疗、语音识别、自然语言处理、智能驾驶、化学等多个领域的应用中发挥着越来越重要的作用。分类是机器学习中最基础、最重要的研究问题之一,其目的是通过构建一个分类器,对于任意输入的数据,能尽可能正确地预测其所属的类别。根据分类器训练过程中是否存在已知的类别标签信息,机器学习的分类方法可以具体分为监督分类、非监督分类和半监督分类三种类型,由于监督分类方法能利用样本和对应的类别标签信息进行学习,通常能获得较好的分类结果,目前的很多研究都是基于监督的分类方法。传统的监督分类方法主要在单一领域的目标数据集中进行模型的训练和测试,随着数据获取技术的持续发展,越来越多的相关工作开始探索使用多种辅助信息数据来解决目标数据集的分类问题,但这些方法通常要求在模型训练过程和测试过程中都能获得相应的辅助数据。然而,在实际情况中,我们可以很容易的在模型训练阶段人为地获取所需的辅助信息数据,但在测试过程中辅助信息的获取往往比较困难,目前这个问题是机器学习领域中的一个前沿研究课题,正受到越来越多学者的关注。目前解决该问题的相关研究工作中,迁移学习和利用特权信息学习是两类代表性方法。本文聚焦于迁移学习和利用特权信息学习理论,针对不同类型的辅助信息,开展了一系列算法研究工作,本文的主要研究内容包括:1)对利用辅助信息学习方法的研究现状进行了系统的总结和归纳,具体从传统的机器学习、迁移学习和利用特权信息学习三个方面介绍了涉及到的相关理论知识和方法原理。2)针对与目标数据特征表示具有相似性的辅助信息数据,本文提出了一种基于稀疏子空间关联分析的迁移学习分类方法框架,学习源领域和目标领域的转换矩阵将数据投影到一个公共的子空间中,基于不同领域数据的自表达特性构建字典,并学习不同领域数据在公共子空间中的稀疏表示,为了减小不同领域数据之间的差异,引入一个正则化项约束投影后的不同领域数据间的特征表示。此外,根据目标领域和源领域数据的新特征表示,构造一个适用于新特征的分类器。3)针对与目标数据配对的单一来源辅助信息数据,本文提出了一种基于迭代特权信息学习的梯度提升决策树方法,在梯度提升决策树训练过程中,利用从辅助信息中学到的线性函数来指导决策树模型的学习,随着不断将单棵树集成到现有模型中,从辅助信息中学到的知识也被同步更新,提出的方法将新决策树的学习和辅助函数的学习整合到一个统一的目标函数中,从而将预测模型的更新与特权信息的利用紧密地联系在一起。在此基础上,本文进一步提出了一种基于稀疏表达的迭代特权信息学习的梯度提升决策树方法,建立以往迭代中学到的投影向量与当前迭代中学习的线性辅助函数之间的关系。4)针对与目标数据配对的多源辅助信息数据,本文提出了一种基于多源特权信息的多核支持向量机方法。本文首先在单一特权信息的支持向量机方法的基础上提出了一种多核支持向量机方法,该方法利用多个不同基核学习多种核函数组成的自适应核矩阵,其中每个基核的权重系数在数据空间中并不是固定不变的,而是适应于样本局部数据。在此基础上,进一步提出了基于多源特权信息的多核支持向量机方法,利用多种特权信息学习模型的松弛变量,构造分类模型。
其他文献
随着我国经济社会的飞速发展,消防安全问题不断显现。火灾事故影响范围较广,危险性较高,对人民生命财产安全造成了巨大的威胁。近年来,随着无人机技术的发展,使用无人机参与灭火救援工作的优势得到普遍认可。本文针对无人机自身特点进行深入分析,提出无人机在灭火救援工作中应用的典型场景,对消防救援队伍调度指挥、灭火救援提供一定的借鉴。
会议
随着对地观测卫星技术的发展,高分辨率遥感卫星已成为高分对地观测系统中重要组成部分。高分辨率遥感影像目标检测是高分对地观测系统中影像信息自动提取及分析理解的重要内容,对高分辨率遥感影像应用价值的发挥具有重要影响。高分辨率遥感影像目标检测是指确定影像中是否存在感兴趣的目标类别对象,并对感兴趣的目标类别对象进行影像定位的过程。本文所检测的影像目标是指具有清晰边界且独立于影像背景的人造地物,如飞机、存储罐
学位
基于倾斜摄影测量的建筑物立面三维模型重建技术能够高精度地采集和恢复真实三维场景,其凭借低成本、高效率、高精度以及全自动化程度等优势,逐渐发展成为城市未来地图构建的主要技术手段,在“智慧城市”和“实景中国”等诸多领域有着重要的应用价值和研究意义。基于倾斜影像的立面三维模型重建是通过改变传统航空摄影测量中只能下视的采集方式,采用倾斜视角以获取建筑物立面结构信息用于建筑物建模,其中,宽基线和大旋转视角等
学位
文中针对电子设备热设计中高效导热垫选型缺乏理论计算的现状,提出了基于导热垫厚度和导热系数计算的导热垫选型方法。该方法以热源与散热板的间隙尺寸链为基础,通过尺寸链公差和导热垫压缩量的关系,推导出导热垫厚度计算方法;通过自然对流散热理论,计算散热板的温度,再以单层平壁导热理论给出的导热系数与温差公式为基础,提出导热系数的计算方法,进而确定导热垫的型号。最后用实例详细介绍了电子设备热设计中导热垫的选型方
期刊
犯罪事件不仅会直接危害受害者的身心健康,还会影响社会的和谐稳定。因此,加深对犯罪案件的理解对于制定有效的防控策略是十分必要的。作为一种地理事件,犯罪案件是发生在一定的空间范围内的,因此地理空间维度对于犯罪分析而言十分重要。警务部门业务信息化的发展及地理信息技术和计算机技术的进步为基于地理空间角度的犯罪研究创造了必要条件。近年来,犯罪地理研究,尤其是基于微观空间层次的研究受到了越来越多的重视。然而,
学位
数字政务的诞生与发展,在促进各级政府提高其社会治理服务能力,构建新型的公共行政体系方面,发挥着非常积极的作用。因此,各级政府都将重心放在了数字政务的建设工作中。然而,由于缺乏足够的人力物力,使其难以适应当前科技发展与创新的大背景,所以各地政府部门纷纷寻求科技公司的帮助,以提升自己对新技术的应用水平,让企业变成“经纪人”,进而在数字政务建设工作中将自己的作用与能力充分展示出来,实现经济与社会效益的双
学位
ZnO和Ga2O3都为宽禁带半导体氧化物,这两者具有良好的光电探测性能,是紫外光电探测器研究领域的重要材料。本论文系统地研究了原子层沉积(ALD)制备ZnO和Ga2O3,探究了最佳退火条件,获得了高质量的ZnO和Ga2O3外延薄膜,同时也使用离子辅助热蒸发制备Ga2O3薄膜。在此基础上,制备了一系列基于金属-半导体-金属(MSM)和异质结结构的紫外光电探测器。主要研究内容及创新成果如下:一、研究退
学位
利用遥感影像进行GIS地理要素的自动更新一直是遥感、GIS领域的研究热点和难点问题,具有重要的理论和应用价值。影像与影像以及影像与矢量的变化检测无疑是其中的核心技术之一。由于高分辨率遥感影像上存在大量“同物异谱,同谱异物”现象,且变化检测过程还容易面临传感器拍摄角度偏差、光照辐射差异、地物特征混淆等因素造成的伪变化问题,至今在该方向上未能有突破性的进展。本文以基础地理信息数据典型要素变化自动发现为
学位
在当前世界各国城镇化进程加速,城市迅速发展和不断扩张的形势下,建筑物三维信息作为城市地理环境信息中基础的一环,为城市空间结构分析、空间演变模式分析以及相关经济、人口数据估算等研究提供信息支持,是城市发展状态评估等重要应用的基础数据资料。利用合成孔径雷达干涉测量(InSAR)可以获取城市地区的三维信息,但是其中建筑物的高度信息提取因为相位解缠,叠掩等问题的存在,仍然是一个相对困难的问题。高分辨SAR
学位
因具有全天时、全天候、全球观测能力,以卫星等空间飞行器为运动平台的星载合成孔径雷达(Synthetic Aperture Radar,SAR)已成为一种不可或缺的空间对地观测手段,这一技术已在文化遗址保护、海洋监测、军事侦察、地质测绘、农林业勘察、环境及灾害监测等领域发挥着非常重要的作用。1978年美国成功发射第一颗星载SAR卫星(SEASAT)以来,世界各国相继研制并成功发射了多颗SAR卫星。新
学位