偏标记特征表示与融合方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:xuan21456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在标准偏标记学习框架下,每个对象由单个特征向量进行刻画,同时与多个候选标记相关联,其中仅有一个未知的真实标记。另一方面,在真实世界问题中对象的性质往往更为复杂,每个对象拥有多源的特征表示并且未知的真实标记也并非唯一。一般而言,有效的特征表示能显著提升学习系统的泛化能力,而偏标记特征表示任务由于标记的真实信息未知而具有较高挑战性。本文针对偏标记场景下的特征表示及融合展开研究,主要包括以下两方面工作:一方面,针对单视图的偏标记训练数据,本文对偏标记降维进行了研究,提出了一种新的偏标记降维方法Delin。该方法通过赋予线性判别分析(LDA)技术处理偏标记训练示例的能力,以提升偏标记分类系统的泛化能力。具体来说,Delin基于候选标记的标记置信度,交替进行LDA降维和候选标记消歧。一方面,利用消歧后的标记置信度对LDA的投影矩阵进行优化;另一方面,在LDA导出的特征空间中使用k NN聚合来消除标记的歧义性。在人工合成与真实偏标记数据集上的实验结果表明,Delin可有效提升现有偏标记学习算法的泛化能力。另一方面,针对具有多视图以及复杂噪声的偏标记数据,提出了一种基于多视图特征融合的偏标记学习算法Fiman。首先,通过自适应融合不同视图特征向量传递的信息,刻画训练示例上的流形结构。然后,通过在标记空间中保留由特征空间诱导而来的流形结构消除训练示例的伪标记。最后,通过将模型输出与消歧后的标记信息进行拟合,学习得到预测模型。大量实验结果表明,Fiman方法可有效求解多视图场景下的偏标记学习问题。本文总共包括五个章节。第一章介绍偏标记学习的相关背景、研究现状以及有待解决的问题。第二章给出了单视图/多视图偏标记学习的形式化定义以及现有算法,并简要介绍经典的降维方法。第三章介绍偏标记降维算法Delin。第四章介绍多视图偏标记特征融合方法Fiman。第五章对全文内容作出总结。
其他文献
近年来,因机器人在工业制造、深海探测以及航天航空等领域内发挥着重要的作用,其控制问题亦成为学术界的研究热点之一。本文将非奇异终端滑模、自适应技术以及有限时间稳定性理论相结合,研究了n关节刚性机械臂系统的轨迹跟踪控制问题。本文主要工作概括如下:(1)针对包含内部不确定和外部干扰的n关节刚性机械臂系统,基于非奇异终端滑模实现对参考轨迹的跟踪。首先,提出了一种包含反正切函数的新型非奇异终端滑模(ATNT
移动机器人作为新世纪智能化关键载体,已逐渐在工业、服务业、农业和航天等领域得到了广泛的运用。随着任务需求以及环境多样性的增加,移动机器人的研究不断面临新的挑战,尤其是其自动化和信息化。本文基于MT-R型移动机器人平台研究移动机器人的导航与抓取问题,具体内容如下:(1)基于单目视觉研究机器人的目标识别与测距算法。依据小孔成像模型利用张氏标定法对摄像机标定,获取相机内参。根据特定目标的颜色和形状特征,
冷轧管性能优越、精度高,广泛应用于国民经济许多领域。新型冷轧管机采用三个直流电机实现轧辊和回转、送进驱动,其性能和运行状态直接决定了冷轧管的质量。已有的冷轧管机现场监控器通过采集驱动电机的电压电流信号实现了对生产过程中冷轧管机运行状态的监控,并能够连接上位机实现监控数据存贮和管理。随着新型冷轧管机的技术升级和普及应用,轧管厂和制造商在设备安装调试、使用维护、故障维修、质量跟踪等方面都面临挑战,需要
类人机器人是智能机器人领域的研究热点,受到机器人学界的广泛关注。本课题针对Robo Cup类人足球机器人Kid Size项目,在东南大学SEU_Uni Robot团队历年研究成果基础上,优化设计和实现完整的类人机器人运动控制系统,以提升机器人运动性能。本文研究内容主要包括:搭建机器人的软硬件系统,采用两层控制器的控制架构,完成舵机执行器、传感器的选型,使用MCU作为机器人下层控制器,完成定时任务和
在传统多标记学习中,每个对象由单个特征向量构成的示例表示,学习系统的目标是构建由示例空间至标记空间幂空间的映射。一般而言,对象的特征表示对于学习系统的泛化性能有着重要影响。如何突破传统的单特征向量表示,提升多标记学习系统泛化性能,值得进一步深入研究。本文围绕多标记特征表示开展研究,主要做了如下两方面的工作:一方面,“类属特征(label-specific features)”表示通过为每个标记构造
零样本学习作为机器学习中的一项新的挑战,越来越多的研究者将注意力放在了这一项新的任务上。零样本学习指的是利用类别辅助信息,在没有对应类别训练样本的情况下,对该类别的样本做出正确预测的任务。零样本学习可以根据测试集中样本的类别分为传统零样本学习和广义零样本学习,也可以根据使用数据的不同,分为类别归纳示例归纳式、类别直推示例归纳式、类别直推示例直推式三种。在先前类别归纳示例归纳式的零样本学习研究中,对
图像内容理解是计算机视觉领域重要的研究目标。分割,尤以细粒度图像分割,是实现图像内容理解的一个重要途径。全景分割,作为细粒度图像分割任务中的一种,可以帮助计算机更全面的理解图像中每一类物体的位置、形状等信息,它的有效解决,将有助于自动驾驶、行为识别等多个问题的发展。本文主要着眼于神经网络建模、针对全景分割问题的计算机视觉方法研究。更具体来说,是通过对数字图像进行像素点级别的分类实现对图像中物体的识
随着社会与现代科技的发展,人们将面临着越来越多的数据,传统的机器学习方法计算开销大,通常难以应用到大规模数据的学习问题上。而当面对大规模学习问题时,在线学习往往是一种易于应用且高效的方法。现有的在线学习方法大致可分为线性模型和核化模型两类。其中,线性模型的计算开销小,所以计算速度快。但当面临复杂数据时,这类模型在精度上很可能表现不佳。后来有研究者引入核技巧(kernel trick),提出了核化模
多标记分类研究中,一个示例(由属性/特征向量表示)会关联多个类别标记,利用多标记数据可以构造一个从示例映射到类别标记集合的分类模型,这样的学习框架适用于多义性对象建模。传统的多标记分类任务中,通常假设实例对应的标记集合是完全准确的。然而,在某些复杂场景下(如网络图片标注),与示例关联的候选标记集合往往含有噪声,需要对含噪多标记分类问题进行研究。本文针对多标记分类中噪声标记问题与多标记分类中特征构造
两阶段学习算法是将一些传统机器学习算法由原始的一步解决问题的过程拆分为两个不同的学习阶段,而问题求解的本质保持不变的学习框架。最初,两阶段学习算法的引入是用来解决核Fisher判别分析(Kernel Fisher Discriminant Analysis,KFDA)在处理高维小样本数据时所面临的病态问题。具体地,两阶段核Fisher判别分析(Two-phase Kernel Fisher Dis