偏标记学习算法及其在图像分类中的应用研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:porminor100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的监督学习需要明确的监督信息,而为示例标注明确的监督信息需要耗费大量的人力和物力,甚至有的标注需要专门的人才才能完成。弱监督学习不仅不需要强监督信息,并且弱监督学习框架更加符合现实生活中的场景,因此弱监督学习框架在机器学习领域受到了广泛关注。偏标记学习是弱监督学习中的一种。在偏标记学习中,每个示例对象都有一个候选集合,该集合带有多个标签信息,其中真正的标签只有一个。偏标记学习的难点主要在以下三个方面,第一是训练示例对应的标签信息是一个集合,而不是明确地指出其对应的真正标签。第二是候选集合中的标签存在相似性。第三是示例与标签之间的联系很难充分利用。基于以上分析,本文提出了两个基于偏标记学习的算法。为了充分利用示例空间与标签空间之间的相似性,本文提出了一个基于低秩和标签传播的偏标记图像分类算法。该算法的创新点有三个,首先基于流行假设充分利用了示例空间和标签空间之间的相似性。流行假设的思想是在示例空间中相似的示例在标签空间中也具有同样的相似性,因此基于流行假设能够将示例空间与标签空间联系起来。其次基于低秩表示矩阵构建示例之间的相似性。相对于基于距离度量的相似性构建方式,该算法采用的低秩表示方式能够构建全局空间并且对高维数据有更好的效果。在构建低秩表示矩阵时加入了稀疏约束,减少示例不平衡对低秩表示矩阵的影响。最后并没有以最大概率值作为对应示例的真正标签,而是将其转换成了一个多输出回归问题。由于矩阵中可能会存在消歧效果不明显的标签,所以候选标签集合中的概率值可能存在平均概率的情况。不以最大概率值做为对应示例的真正标签,减少伪正例对预测模型的影响。大量实验证明了使用低秩表示矩阵表示示例与示例之间的相关性,并且将这种相关性延伸到标签空间对分类性能有很大作用。为了突显出真正的标签,本文提出了一个基于标签最大置信度的偏标记图像分类算法。该算法主要有两个创新点,第一是在模型的损失项中增加每个示例置信度的无穷范数,突出候选标签集合中的真正示例。平均消歧策略有一个很大的弊端即消歧后的置信度矩阵中存在消歧效果不明显的示例。该算法改善平均消歧策略劣势,突出候选标签中的真正标签。第二是基于图拉普拉斯约束项充分利用示例之间的相似性。图拉普拉斯项使目标函数中的相似示例会有相似输出,使得突出的标签接近真正的标签。大量的实验结果表明,基于标签最大置信度的方法在图像分类问题上有着很好的性能。
其他文献
铁路是我国重要的基础设施,以自身的经济性和普及性成为一种被广泛使用的运输方式,在交通运输体系中处于骨干地位。作为高速铁路核心的电气化牵引供电系统能否可靠稳定地运行
对跨文化交际理论进行研究;分析了我国外语跨文化教育中所存在的问题;指出跨文化交际中容易出现的文化失误;根据跨文化交际意识及能力培养的必要性,指出外语教学应转向语言教
“跨文化交际”指的是不同文化背景的个人之间的交际,也就是不同文化背景的人之间所发生的相互作用。以前,这主要是文化人类学、民族学所关心、研究的问题,近年来,它正在引起一般
2型糖尿病主要是一种胰岛素分泌不足且伴胰岛素抵抗的代谢紊乱性疾病[1]。二甲双胍为临床治疗糖尿病的有效药物,但单纯应用疗效不佳,且易发生低血糖等不良反应[2]。而仅予中
<正>我国农村土地承包经营权的流转始自上个世纪80年代初,至今虽已有20多年,但在很长一段时期内是个别农户之间自发的转包、出租流转占主导地位,流转的规模不大且相对稳定,一
一、研究目的与意义20世纪以来东欧国家由于缺乏西欧那种民族国家政治、经济、文化方面的整合,而一直处于不稳定状态。特殊的地理地形和地缘政治环境使得东欧在历史上一直是
2016年发生于温州小区20年住宅用途的建设用地使用权已经到了使用期限该如何续期事件,又引起社会群众的高度关注,对社会上城市住宅用途的建设用地使用权利期限届满后如何续期成为学术界讨论的热点。2007年颁发公布的《物权法》第149条规定,住宅建设用地使用权在到期后自动续期。根据这项规定,国家在立法上,保护了房屋所有人的财产所有权不被侵犯,无需提出续期申请而享受自动延长建设用地使用期限的权利。但是此规
根据目前企业普遍存在的管理层对“人力资源”观念淡薄、人力资源缺乏、员工队伍素质下降的现象,分析了企业管理,特别是人力资源管理中培训、晋升、沟通、流动等管理活动中关于
将项目教学法和信息化教学法同时引入到高职食品理化检测技术课程教学中,根据项目教学法遵循的一般原则,结合实际,设计了具体项目,将项目化和信息化有机结合,切实提高了学生
采用国外引进程序和Flowmaster软件,对一台20MW汽轮发电机转子的通风及温升进行研究,得到了风量分配和温度分布结果。针对计算结果对结构进行了优化,使温升能够满足技术指标要求