基于鲁棒策略的深度自动图像标注

来源 :福州大学 | 被引量 : 0次 | 上传用户:Yeah12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动图像标注是一种给未知图像添加能够描述该图像语义内容的关键词的技术,是计算机视觉领域中图像检索与图像理解的关键步骤。本文针对传统图像标注模型难以训练不平衡数据、标注过程单一难以提升整体标注效果、人工选取特征效率低下等问题,在模型理论、标注框架、视觉特征等方面提出了多个解决办法,本文的主要工作包括:(1)针对传统浅层机器学习算法在处理复杂分类问题时存在泛化能力不足的问题,提出了基于非线性栈式自动编码器(NL-SAE)的自动图像标注模型。该模型主要针对图像标注数据不平衡问题,提出一种增强训练中低频标签的非线性平衡栈式自动编码器(NL-BSAE),并在此模型基础上提出一种分组强化训练NL-BSAE子模型的非线性鲁棒平衡栈式自动编码器算法(NL-RBSAE),提升了标注的稳定性,从而保证模型本身具有较强地处理不平衡数据的能力。此外,本文提出以未知图像作为出发点,通过并判定该图像的高低频属性来决定不同的标注过程,构建融合NL-RBSAE的属性判别标注框架(NL-ADA),保证了标注过程具有较强地应对不平衡数据的能力。(2)针对非线性SAE模型在训练过程中,收敛速度缓慢,不适合训练中小型数据集的问题,提出了基于线性栈式自动编码器(L-SAE)的自动图像标注模型。该模型首先建立增强训练中低频标签的线性平衡栈式自动编码器(L-BSAE),并在此模型基础上提出一种分组强化训练L-BSAE子模型的线性鲁棒平衡栈式自动编码器算法(L-RBSAE),最后构建融合L-RBSAE的属性判别标注框架(L-ADA),该方法改善了非线性SAE模型训练中小型数据速度上的不足。(3)针对传统图像标注方法中人工选取特征费时费力,以及传统标签传播算法忽视语义近邻而影响标注效果等问题,提出了融合深度特征和语义邻域的自动图像标注方法。该方法首先构建基于深度卷积神经网络(CNN)的统一、自适应深度特征提取框架,接着对训练集划分语义组并建立待标注图像的邻域图像集,最后根据视觉距离计算邻域图像各标签的贡献值并排序得到标注关键词,该方法可以实现自适应特征提取并改善标注效果。通过在三个公共数据集上的实验结果表明,本文提出的方法有效改善了模型训练不平衡数据的效果,提升了中低频标签的标注效果,提取的深度特征相比传统人工特征有着维数更低和效果更好的优势。综上,本文提出的多个方法都较好地改善了整个模型的标注准确率和准确预测到的标签总数。
其他文献
随着人工智能和模式识别技术的飞速发展和人民生活品质的提高,音乐成了人们生活中必不可少的交流媒介之一。互联网的飞速传播衍生出了大量优秀的音乐作品,如何对种类繁多、曲
近年来,在我国农业发展过程中农民数量骤减、结构失衡、素质下降等问题日益凸显,发展农业已成为全社会热切关注的问题,也引起了中央的高度重视。农民是新农村建设的主体,建设
黄土地区在我国分布十分广泛,近年来随着国家建设的高速发展,黄土地区的基坑工程建设越来越多。黄土具有块状结构,垂直节理发育,孔隙大等特点。当其在一定压力和水的作用下湿陷时,土体结构快速破坏,承载力急剧下降,对工程施工安全造成严重危害,湿陷性黄土基坑工程的施工安全问题急需得到解决。本文以实际工程为例,采用监控量测与数值分析结合的方法识别湿陷性黄土基坑风险。在风险识别的基础上建立风险评价体系,进行风险的
随着多核处理器的发展,传统多核架构已经难以满足大规模计算的需求,工业界通过将不同类型的处理器整合于同一个芯片上,形成异构多核处理器架构。经过多年的研究和优化,多核处
提高图像分辨率以及质量图像的重建技术对人类视觉和各种计算机视觉系统具有重要意义。作为图像复原的一个分支,超分辨率图像重建问题逐渐引起学者的广泛关注。遗传计算方法
体育作为教育的重要组成部分,在当今时代越来越凸显其地位;学校体育作为体育的重要内容,在促进学生全面发展过程中的作用不可忽视;而小学体育作为学校体育的基础阶段,不论是从学校体育发展的内在逻辑上来说,还是从个体的长远性发展来说,都起着奠基性的作用;小学体育课程作为小学体育的重要内容,是小学体育发展状况的集中体现,也是小学体育教学效果的决定性因素。小学体育课程在漫长的历史过程中实现了跨越转型式发展,清末
“说数学”活动是指在教学过程中教师提供学生“说”的平台,学生用精准的数学语言、通俗语言、文字语言或肢体语言的方式来表达自己对数学知识的理解及想法,达到师生互动的一种活动。传统教学重视教师的传授而轻视学生的自主学习,忽视了学生理解和内化数学知识的过程以及数学思维的培养。而以学生的学为主体的“说数学”教学活动将发挥学生的主体地位,对教学效果产生深远影响。第一部分介绍了本文的研究背景、研究意义、研究内容
当今社会,石油资源的不断减少和国民经济发展对资源索求的急剧增加,使得可再生的植物油作为一种清洁能源成为全世界范围内的研究热点。目前常见的用于植物油加氢脱氧的催化剂存在活性低和水热/机械强度稳定性差等问题,因此开发具有高活性、高水热/机械强度稳定性的催化剂是发展生物柴油技术的关键。本论文采用溶胶凝胶法制备了本体型加氢脱氧催化剂,实验过程中在微固定床反应装置上评价催化剂的加氢脱氧活性,重点考察了扩孔剂
互联网技术的发展改变了分布式系统的应用和规模,这也对这种系统的灵活性和可扩展性提出了更高的要求。由于发布/订阅系统具有异步传输、多点通信和松耦合等优点,已被广泛应
目标检测与跟踪技术是计算机视觉领域中的一个研究重点,被广泛地应用在人们的日常生活与工作当中。随着人工智能的高速发展,海量的图像序列也随之产生,对于目标检测与跟踪的