【摘 要】
:
多标签图像分类是图像分类领域的一个重要研究课题,是对单标签图像分类任务的拓展。相对于单标签图像分类任务,多标签图像分类具有更大的复杂性,并且由于标签之间存在一定的相关性,所以探索标签之间的相关性来辅助多标签分类是一个十分有意义的课题。本文以多标签图像分类为目标,重点探索模型各部分蕴含的标签相关性对模型性能的影响。主要基于ResNet骨干网络进行改进,并在基准数据集(MS-COCO和NUS-WIDE
论文部分内容阅读
多标签图像分类是图像分类领域的一个重要研究课题,是对单标签图像分类任务的拓展。相对于单标签图像分类任务,多标签图像分类具有更大的复杂性,并且由于标签之间存在一定的相关性,所以探索标签之间的相关性来辅助多标签分类是一个十分有意义的课题。本文以多标签图像分类为目标,重点探索模型各部分蕴含的标签相关性对模型性能的影响。主要基于ResNet骨干网络进行改进,并在基准数据集(MS-COCO和NUS-WIDE)上均提高了分类性能。该课题的研究依托于国家自然科学基金“3D形变体的保测变换与稀疏流形嵌入识别方法研究”。具体工作包括以下几方面:●探索分类器蕴含的标签相关性对模型性能的影响。输入图像通过骨干网络的一系列卷积层得到抽象的图像特征,其中编码了图像中不同的语义信息,随后图像特征通过各个类别独立的二元分类器判断标签是否存在,因此推测不同标签对应的二元分类器蕴含标签相关性。首先探索一系列骨干网络的分类器蕴含的标签相关性,其次通过引入约束项来消除标签相关性,以及通过Word2Vec方法增强标签相关性,探索标签相关性对模型性能的影响。该工作在基准数据集MS-COCO上进行多标签分类任务的实验。● 探索图像特征蕴含的标签相关性对模型性能的影响。本工作提出了基于邻接相似度的图嵌入方法(ASGE)以及跨模态注意力机制(CMA),尝试在骨干网络提取的图像特征中产生蕴含标签相关性的注意力图,通过注意力图来强化图像特征,由此在图像特征中引入标签相关性,探索在图像特征中引入标签相关性对模型性能的影响。该工作在基准数据集MS-COCO和NUS-WIDE上进行分类任务的实验,均取得不错的结果,并且该工作的一部分内容发表在AAAI2020会议中。●对第二个工作进行一系列改进,包括:将分步训练修改为端到端训练、为多尺度模型提供多个标签嵌入,以及探索不同的特征融合方法,使得改进后的模型能在基准数据集MS-COCO和NUS-WIDE上取得十分稳定的性能提升。本文主要采用Pytorch框架和Python语言实现上述研究中的算法,并进行了大量实验分析以验证算法的有效性。训练与测试样本来自微软提供的MS-COCO基准数据集,以及新加坡国立大学提供的NUS-WIDE基准数据集。我们基于ASGE模块和CMA模块提出了两个单尺度模型——分类器共享(CS)模型和分类器不共享(CU)模型,以及一个多尺度模型(MS-CS),在MS-COCO数据集上,三个模型的mAP指标分别为82.6%、83.4%和83.8%,而在NUS-WIDE数据集上,CU模型和MS-CS模型的mAP指标分别为60.8%和61.4%。其次,尝试对网络结构进行改进,使得MS-CS模型在MS-COCO和NUS-WIDE数据集上的mAP指标提升为84.5%和63.5%,而CS模型在MS-COCO数据集上的mAP指标提升为83.3%,对分类器共享模型能得到较稳定的性能提升。
其他文献
广泛存在的细菌多药耐药性问题,使得发展新型抗生素的需求迫切。抗生素自问世以来拯救了无数生命,然而近年来抗生素滥用问题日益严峻。世界范围内新的耐药菌不断出现,当下抗生素研发步伐却放缓,上市的抗生素药物也在极短时间就发现了耐药菌株,导致抗菌治疗问题日益严峻,临床上甚至已经出现无药可用的紧迫情况。因此,急需寻找新的抗生素药物来治疗这类感染性疾病。抗菌肽(antimicrobial peptide,AMP
天然气水合物作为新型非常规清洁能源而备受关注,全球97%以上天然气水合物藏发现于大陆边缘海底沉积物中。当天然气水合物藏温压条件改变,天然气水合物将发生分解,释放向上渗漏的甲烷流体。甲烷向浅层运移过程与沉积物孔隙水中硫酸盐发生的甲烷厌氧氧化(SR-AOM)作用,最终与孔隙流体中金属离子反应形成碳酸盐和硫化物等相关自生矿物,并对自生矿物形态及结构产生影响。渗出海底的甲烷流体,经氧化将形成不同产状和矿物
目的:临床同种异体移植的成功是以终生服用药物来源的免疫抑制剂为代价的,长期使用免疫抑制剂具有较多副作用。既往的研究表明间充质干细胞(Mesenchymal stem cells,MSC)具有免疫调节功能,在器官移植中可以调节炎症的进程并改善移植物的状态,现有研究证明,MSC在体内外均有免疫调节的作用,且可以延长移植物的存活时间。此外,在临床移植中,MSC已被多次应用并证明其安全性。在本研究中,拟通
T细胞白血病1(T-cell leukemia/lymphoma 1,Tcl1)在白血病中作为原癌基因,已有文献报道Tcl1在肝癌中与戊糖磷酸途径有关。然而,Tcl1是否在结直肠癌(Colorectal cancer,CRC)的发生发展中发挥作用尚无明确报道。因此,我们研究了 Tcl1在CRC中的作用。利用蛋白质免疫印迹(Western Blot,WB)和逆转录-聚合酶链反应(RT-PCR)验证T
当前全球数字化社会建设日益成熟,云服务日渐得到个人、组织机构和大型企业的青睐,可预见未来所有的组织机构都将使用云服务。与此同时,文件共享和文件协作是近六年来使用率最高的云服务类别,这对云服务中文件共享和文件协作、以及文件同步技术提出了更严峻的挑战。针对云同步技术收到的挑战,如何提升云同步性能,为庞大的用户群体提供优质的服务是亟需解决的问题。首先,分析现有云同步技术在大规模应用云服务场景下的同步效率
21世纪进入了信息化的时代,信息化已经进入各行各业,并且信息化技术变成了当今世界上发展最迅速的产业,与此同时,人们对信息化的要求越来越高,对信息化的需求的变化日新月异。我们如何能快速完成项目的上线,如何能快速响应需求的变更一直是各个技术团队希望解决的问题。要解决这个问题,需要拥有一个高效快速的二次开发系统,能让系统更快的投入生产,更能拥抱需求的变更。而一个高效快速的二次开发系统首先系统架构上要整体
随着互联网的高速发展,越来越多的网民在社交平台发表言论,促进了世界的多元化交流。但问题也随之而来,大量的谣言也在社交平台上传播,一些涉及公共安全的谣言,更是对社会稳定造成巨大伤害。然而目前的谣言检测侧重于文本特征、用户信息以及传播结构信息,它们本质上仍然是通过分析用户的发布意图来检测文本的虚假性,却忽略了知识的重要性,在目前谣言数据集数据量少、收集困难的情况下更是影响到谣言检测的性能,因此外部知识
核电站的兴起缓解了当今的日益增长的能源供需矛盾。然而,2011年发生于日本福岛核电站的重大核事故再次使人们将目光集中在核安全的问题上,该事故暴露了燃料颗粒包壳锆合金在高温水蒸气下易发生锆水反应释氢的安全问题。基于该背景下,一种被称为“事故容错燃料”(Accident-tolerant fuel,ATF)的技术概念得以提出。在该技术概念中表面覆膜技术因其成熟的工艺和应用而受到青睐,其中非晶/晶体纳米
人们的日常生活和软件应用服务越来越无法分离。为了应对不断变化的需求,软件开发团队能够快速的对产品进行迭代变得越来越重要。随着微服务、DevOps、容器技术的逐步发展,云原生应运而生,为软件应用服务的快速迭代提供了解决思路。目前谷歌开源了 Kubernetes为容器的管理提供了帮助,但主要是作为容器的编排工具,不能够完全涵盖云原生应用从源代码到发布的整个流程。本文基于Kubernetes实现了一个云
甲骨文,是中国最古老的象形文字,在漫长的汉字发展史上起着举足轻重的重要地位。但要识别未释读的字或者收集、分类相关实例内容是需要花费很多的时间和精力。而利用图像检索技术可以在海量的图像大数据中以较小的时空开销准确地找到一幅相似的图像,图像检索也成为近年来多媒体和信息检索领域的重要研究热点。因此,如何利用图像检索技术对甲骨文图像进行分类与识别的研究也具有非常重要的意义。图像检索的本质是通过对图像进行特