【摘 要】
:
图像分类是计算机视觉领域的研究重点之一。而随着信息技术的飞速发展,多标签图像的识别与学习成为了许多深度学习领域研究人员的关注重点。与单标签分类不同的是,多标签图像分类是需要对图像中出现的一组目标标签进行预测分类。为了提高分类效果,需要对标签依赖进行建模,在实际的分类场景中,由于存在数据量庞大、种类较多、标记不易等原因,图像数据常常含有大量缺失标签信息的弱标记图像。如何利用这些缺失了部分标签的图像来
论文部分内容阅读
图像分类是计算机视觉领域的研究重点之一。而随着信息技术的飞速发展,多标签图像的识别与学习成为了许多深度学习领域研究人员的关注重点。与单标签分类不同的是,多标签图像分类是需要对图像中出现的一组目标标签进行预测分类。为了提高分类效果,需要对标签依赖进行建模,在实际的分类场景中,由于存在数据量庞大、种类较多、标记不易等原因,图像数据常常含有大量缺失标签信息的弱标记图像。如何利用这些缺失了部分标签的图像来执行分类任务并取得良好的效果,是当前深度学习研究的热点之一,也是本文的研究内容。针对图像标签缺失的多标签图像分类算法,如何提升算法的分类效果,本文基于图卷积模型对遇到的两种不同类型的缺失标签的多标签图像数据进行的研究,主要的工作如下:1、研究基于图卷积神经网络的多标签图像分类算法,并针对多标签图像中只有部分标签被标记的多标签图像提出了一种适用于此类型多标签图像的基于图卷积神经网络的算法。由于标签存在着相关性,本文通过改造条件函数的方式来建立一个有着标签之间的相互依赖关系的模型,并设计了一个标签相关系数矩阵用来对标签相关性开展模型构建。这样的方式可以充分地分析标签的拓扑架构,提升其之间的知识共享水平。这样的模型可以在出现缺失了部分标签的情况下减小由于标签缺失所产生的误差,从而提高了对标签信息进行预测补足的能力。根据三个已有的多标签数据集实验可知,该模型在标签信息不完整的情况下对标签之间的依赖关系探究方面和多标签图像分类方面均取得了良好的效果。2、针对图像中只有部分标签被标记和标签缺失的问题,随着标签空间中标签数据不断增加,需要构建的全局有向图和构建标签相关系数矩阵越来越大,矩阵更新所需的时间复杂度和空间复杂度有了极大的提高。因此本文提出一种适用于此类型的缺失部分标签的多标签图像分类算法模型。该模型构建了部分结构关系矩阵来描绘不同标签间的关系,在局部关系矩阵内利用了低秩特征映射来加强挖掘特征空间中标签的关联性,可以借助低秩标签具备的关联特性来恢复矩阵中已经丢失的标签以辅助分类过程的进行。将改进的算法在数据集上进行分类试验,试验结果表明此类算法可以有效的恢复标签,并且提高了分类的性能。通过本文的两个主要工作进行多标签分类算法的设计以及对相关实验数据集进行调整修改后,在实验环节安排上,采用了三种在多标签领域具有代表性的实验数据集与其他四种多标签分类算法进行比对验证。通过详细准确的实验结果表明,本文所提出的基于GCN的多标签图像分类算法在对于仅包含部分标签的数据集中学习分类,能够有效的对缺失的标签进行恢复,并具有显著的分类效果。
其他文献
由于人的面部外观会随着时间流逝引起的衰老而产生较大的类内变化,因此年龄不变的人脸识别(Age-invariant face recognition,AIFR)仍然是一个充满挑战的研究热点。以前的深度学习人脸识别方法没考虑到年龄的变化带来的类内差异,在跨年龄数据集测试上的效果不够好。主流的研究思想将一般人脸识别特征视为与身份识别相关和与年龄变化相关的两个部分的线性组合,尝试去除一般人脸特征中随年龄变
污泥厌氧消化产生的消化液具有高氨氮和低碳氮比的水质特点,对其进行高效处理对降低城市污水处理厂的氮负荷和增强其脱氮效果具有重要意义。本研究通过两段式部分亚硝化-厌氧氨氧化(PN/A)工艺处理模拟的污泥消化液。以连续流生物滤柱反应器(CBFR)为试验装置,首先实现部分亚硝化(PN)的启动和稳定运行,即建立并运行PN-CBFR;然后分别在两个反应器中实现厌氧氨氧化(ANAMMOX)工艺的高效脱氮。其中,
随着社会的快速发展和超高层建筑的不断兴起,作为流行的固定升降设备的电梯已经成为现代城市内高层建筑中必不可少的一部分,其能耗问题也被广泛关注。然而,传统的同步电机具有运输效率低、候梯时间长、占地面积大和提升高度有限等缺点,并且其励磁方式需要额外的励磁绕组、滑环和电刷,在增加电机体积的同时还大大增加了电机的运行损耗,也降低了效率。而永磁同步电机取消了励磁绕组的独特结构,使得电机的效率得到较大的提高,更
语音识别是使得机器可以识别人说话的一项关键技术,而在语音识别技术中,语音的声学特征和语音识别模型是决定语音识别性能的两大重要因素。在语音识别的研究中最常提取的声学特征为梅尔倒谱系数(MFCC),这类特征是从原始语音中提取的一些底层特征,通常包含冗余信息,这也将在一定程度上干扰识别结果。近些年的研究表明,基于稀疏表示方法得到的一些高层特征在语音识别领域表现出的性能要优于使用传统特征进行识别的性能,这
随着信息技术的飞速发展,海量的数据产生带来了信息过载和选择障碍的困扰,每个用户的时间和精力都有限,面对海量资讯,如何帮助用户在短时间内进行数据的过滤和选择并获取有价值的信息,具有非常重要的现实意义。面对“信息过载”,根据用户在系统中访问的历史行为数据,进行深层兴趣点挖掘,为用户提供个性化的、精准的信息推荐,不仅满足用户本质的信息诉求,而且最大化企业的自身利益,因此个性化、精准信息推荐蕴含着无限的商
移民新村是中国政府统筹规划布局、对乡村进行扶贫发展的重要举措。甘肃是我国西北地区移民任务最重的省份之一,省内移民新村地域分布广、数量多、建设历史长,其空间品质优劣直接关乎移民能否留得住,能否切实解决移民生活难、看病难、上学难、吃水难以及行路难等实际困难,同时对乡村振兴具有广泛深刻的意义。科学评价移民新村空间品质,不仅有助于针对性地对石沟新村空间品质的提升提供科学的指导,同时为陇中地区移民新村空间品
随着科技水平的提高和技术融合的发展,网络化控制系统近年来逐渐走进了人们的视野,并且越来越受到人们的关注。因其具有资源共享、系统简便、容易构建、灵活性强等优点,因而广泛应用于诸如互联网以及通信领域、交通领域、智能制造领域、航空航天甚至军事等各个领域。而在实际控制中,因网络化系统的各个节点所面临不同的情况以及其中不同节点之间的通信延迟,常会影响到系统的稳定性,进而对系统的工作效率产生不良影响。由于网络
住区是城市空间系统的重要组成部分,住区边界则承担着界定和沟通住区与住社区、住区与其他城市空间的重要功能,住区边界空间不仅承载着丰富多样的城市化生活,也与居民的生活品质密切相关。现代城镇居住建设与发展中存在的很多矛盾与问题在住区边界空间中一一体现。随着中国城镇化进程的加快,小城镇建设进入飞速发展阶段,小城镇住区的布局和规模对其空间建设起到至关重要的作用,不仅影响到小城镇的空间结构,也影响到其经济等方
保障资源是地下工程空调系统正常运行的基础,其中柴油保障资源为空调系统等供电,冷却水保障资源存储空调系统的冷凝热。然而,地下工程空调系统能耗偏大,浪费了较多的柴油保障资源;在冷源不可补充时,地下工程各分区存在某一分区的空调水库冷量耗尽而其他水库冷量却很“富裕”的现象,导致冷却水保障资源利用不充分。因此,针对地下工程保障资源存储量有限的情况,以某地下工程的空调系统为研究对象,基于负荷预测技术对地下工程
基于音频信号的故障检测是人工智能领域的新兴研究点,具有重要的应用价值。在实际应用的场景中,目前传统的电视机制造工厂里,对电视机扬声器的故障检测一般使用人工听检的手段,这种方式标准不一,容易造成误诊断的问题,导致问题产品流入市场,同时需要消耗大量的人力资源,且长时间的噪声工作环境也会对工人的听力造成损害。随着工业4.0的到来,各类工厂都在进行自动化改造,以提高效率和准确率,因此将传统人工故障听检手段