【摘 要】
:
图像分类是计算机视觉领域研究热点之一,图像多标签学习方法更是在图像分类任务中有着广泛的应用。随着大数据时代的到来,图像数据日益猛增,由于不同领域对图像数据关注的角度不同,导致图像只标注部分的语义标签,图像所表达的语义信息不能被充分体现,即图像数据存在标签缺失。随着图像数据蕴含的信息量越来越大,对应的标签类别数目也在不断增加,对图像样本预测的可能标签集合会呈指数形式增长,导致在多标签分类过程中,面临
论文部分内容阅读
图像分类是计算机视觉领域研究热点之一,图像多标签学习方法更是在图像分类任务中有着广泛的应用。随着大数据时代的到来,图像数据日益猛增,由于不同领域对图像数据关注的角度不同,导致图像只标注部分的语义标签,图像所表达的语义信息不能被充分体现,即图像数据存在标签缺失。随着图像数据蕴含的信息量越来越大,对应的标签类别数目也在不断增加,对图像样本预测的可能标签集合会呈指数形式增长,导致在多标签分类过程中,面临预测输出空间庞大的问题。随着深度学习的发展,以卷积神经网络为基础的分类模型具有强大的表征能力,能够提取图像高级语义特征,对比传统的分类模型在性能和精度方面有了较大的提高。因此,本文针对标签缺失的图像多标签分类任务中存在预测输出空间庞大和训练数据不足等问题,提出以卷积神经网络为基础的深度残差网络作为主干网络,构造相关性残差网络树模型,用于多标签图像数据的分类任务。通过实验验证了该模型的有效性,主要研究工作如下:(1)提出深度网络树模型,对标签缺失的多标签图像数据进行分类。在深度网络树模型中,将每个深度神经网络作为该模型中不同的分支结构。然后,利用该模型的不同分支对图像数据中每个标签类别独立训练一个基分类器,对图像样本的每个标签类别属性进行预测,从而避免了多标签分类过程中预测输出空间庞大的问题。(2)提出基于标签共现性学习样本选择策略,用于解决训练数据不足和标签缺失图像样本对深度网络树模型训练过程中造成的干扰。通过从图像数据中原有的标签信息中计算两两标签类别同时关联于一个图像样本的概率,描述标签类别间共现性强弱。对于每个标签类别,选择与该类别共现性较强的标签类别对应的图像样本,作为正例学习样本,反之,作为负例学习样本,从而为深度网络树模型中的每个分支的基分类器,构造相应的二元训练数据集进行学习。通过在3个多标签图像数据集实验,得出以残差网络(Residual Network,Res Net)为基分类器的深度网络树模型,总体性能最佳,进而提出残差网络树模型(简称Res Net-Tree)。(3)提出相关性残差网络树模型(Correlation Res Net-Tree model,C-RNT),对标签类别间的语义相关性加以利用,进一步提高模型分类性能。通过标签类别间的语义相关性构造标签相关矩阵,基于该矩阵的低秩结构表示,来挖掘标签类别间的高阶语义相关性,并利用低秩表示矩阵对原始标签矩阵进行增强,从而对图像样本与标签类别之间的关联性进行建模,得到相关性模型。利用最小二乘目标损失函数对Res Net-Tree模型与相关性模型进行联合学习,建立C-RNT模型,对图像样本进行标签恢复。实验结果表明,本文提出的C-RNT模型能够有效解决图像数据标签缺失下的多标签过程中预测输出空间庞大、训练数据不足等问题。较传统的图像多标签分类算法在各项性能指标有不同程度的改善,对图像多标签学习具有较强的理论和实际意义。
其他文献
高中阶段是青少年社会化的关键时期,2013年,教育部启动的普通高中课程修订工作中进一步明确了普通高中教育的定位,指出普通高中教育的任务是促进学生全面而有个性的发展,为学生适应社会生活、高等教育和职业发展做准备,为学生终生发展奠定基础。高中思想政治课是以立德树人为根本任务,以培育社会主义核心价值观为根本目的,帮助学生形成正确的政治方向以及正确的三观,还培养学生的学科核心素养,增强社会理解和社会参与能
晶体振荡器作为频率源,在通信、卫星导航、靶场、作战指挥、电力、金融、智能制造等领域有着广泛的应用,涉及物理、测量、机械等多个学科。一般情况下,当存在外部参考时钟源时,晶振处于驯服状态,当参考时钟源不可用时,就必须采用频率补偿技术来维持本地晶振输出频率的精度和稳定度。本论文就守时系统在失去参考时钟源后如何对本地晶振的输出频率偏移进行补偿展开研究。首先阐述了晶体振荡器的发展历史、应用及研究现状,由众多
随着高中思想政治课程的改革,“综合探究”部分成为教学组成的一个特色板块,是思想政治课教学过程中必须重点解决的部分,对“综合探究”板块的研究成为我国当前学科教学的前沿领域。人教版高中思想政治教材设置了“综合探究”板块,它以每单元末尾为一节“综合探究”,四本必修课程共计十六节“综合探究”板块。它是单元内容的拓展和延伸,有利于帮助学生深化对知识的理解,锻炼学生的创新力与探究力,进一步增强教学的实效性、实
课前预习是物理学习的重要环节,也是培养学生自主学习和学会学习的途径之一。随着时代的进步和发展,学生学习不仅学习基础知识,更重要是学会学习,为个人发展和终身学习打下扎实基础。高中物理课前预习是高效学习物理的方法之一,也是培养学生学会学习的有效途径。笔者以毕节地区部分高中为例,调查学生物理课前预习情况,提出预习对策。首先,以认知发现学习理论、建构主义理论、人本主义理论为理论基础,采用文献法分析思考课前
在高考改革的背景下,浙江取消了原先的文理分科制度,把物理考试内容分为“学考”和“选考”两块内容,学生可根据自身意愿和高校招生录取要求,来选择是否参加物理的选考,充分体现了学生自主选择权。此番改革从多维度教育出发来促进学生的全面发展,也是国家倡导素质教育的体现。面对浙江新高考制度,研究者通过查阅文献发现,自2014年高考改革以来,所有有关浙江新高考物理的文献主要集中在“初高中衔接问题”、“教学模式转
介观荧光分子层析成像(Mesoscopic Fluorescence Molecular Tomography,MFMT)通过寻找组织表面荧光测量信号与体内荧光参数(即敏感矩阵)之间的关系,对较大视野的厚组织(毫米级深度)进行高分辨率(微米级)非接触式成像,很好地填补了显微荧光分子成像技术和宏观荧光分子成像技术的真空地带。然而,探测到的荧光信号经过生物组织多次散射,与敏感矩阵构成了非线性关系,使得
音乐名师工作室是音乐教师职后培训的一种新形式,是随着我国基础教育发展和教师专业化发展的需求,应运而生的由音乐学科的名教师引领同一学科的教师所组成的研修团体。是名师带领学员教师进行教学、科研、培养、辐射为一体的教师专业化发展新平台。贵州省少数民族多,民族文化资源丰富。近年来,当地教育管理部门积极出台了一系列促进民族文化传承的学校音乐教育建设措施。而贵州“双百工程”教育改革的提出,以传承民族文化为特色
在现代生活中,时间是一个必不可少的参考量。时钟同步系统以提供精准时间信息为主要功能,已广泛应用于机场、轨道交通、高校、医院与场馆等场所,为人们提供时间显示服务、为众多智能设备和信息化系统提供时间同步服务,使它们步调一致、有序工作,是一种重要的基础设施。目前时钟同步系统存在有线网络成本高、不灵活与后期改动困难等弊端,Zigbee与WiFi等技术通信距离短,难以满足远距离授时的需求。本文根据LoRa远
介观荧光分子层析成像(Mesoscopic Fluorescence Molecular Tomography,MFMT)是一种在介观尺度下的光学分子成像技术,它填补了宏观荧光分子成像和光学显微成像在成像空间分辨率为介观尺度(10μm-1000μm)上的真空地带,且能够在几毫米深度的生物组织内获得荧光靶点的三维分布,分辨率最高可达约100μm。然而,荧光靶点的重建问题实质上是一个不适定且病态的逆问
随着人脸识别认证系统的快速普及,防止合法用户人脸受到非活体的虚假人脸攻击极为重要,因而人脸活体检测技术的应用需求日益提升。人脸活体检测技术作为保障人脸识别认证系统安全性的重要环节,已广泛应用于智能安防,智能家居,医疗教育等重要领域。本文针对活体检测领域的照片和视频攻击方式的识别问题,通过增强图像的真伪判别性以及增强图像的时空特征相关性,从三个不同的角度对图片和视频攻击的人脸活体检测进行了算法研究,