多标签图像分类中的标签语义特性建模研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:gongbin1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签图像分类作为计算机视觉领域的基础任务之一,其目标是从复杂的图像中识别出多个不同类别的目标并赋予其对应的一组标签。随着近些年自然语言处理与知识迁移的发展,一些研究人员尝试将自然语言处理任务中学习到的语义知识迁移至多标签图像分类任务中,提出了一系列的极具创新性的多标签图像分类解决方案。尽管如此,这些探索多标签语义信息的方法往往只考虑将语义信息作为视觉特征的补充或者辅助信息来指导分类器的学习,而视觉空间、语义空间、标签空间三者之间潜在的相关性暂未得到有效的探索和利用,这为进一步提升多标签图像分类性能提供了一种可能的解决方案。基于上述发现,本文将从线性与非线性的角度对多标签图像分类中的标签语义特性展开研究:(1)多标签图像分类中的语义字典学习研究:引入字典学习技术,将多标签图像分类任务转化为语义字典查询任务,提出了一个深度语义字典学习模型。从标签的语义信息中派生出语义字典,利用字典原子的线性组合对视觉特征进行协同编码,以归一化后的协同编码系数作为视觉特征的标签嵌入,从而构建起视觉空间、语义空间、标签空间之间的线性表示关系,协调和探索三者之间的相关性。为了实现对语义字典与编码系数的联合优化,进一步设计了一种新的适用于深度字典学习的优化策略——迭代式参数优化策略。(2)多标签图像分类中的语义组合学习研究:在实际的应用场景中,图像的视觉特征往往不能被简单的视为所包含物体的类别原型的线性组合,而是更为复杂的非线性组合问题。为了进一步探讨多标签图像分类任务中的非线性语义组合问题,引入组合学习概念,提出了一个深度语义组合学习模型,对多标签图像中存在的非线性语义组合特性进行建模,并通过组合学习前后图像的视觉差异性来解决多标签图像分类问题。为了构建组合学习与多标签图像分类之间的联系,从常见的度量方式中派生出了变换表征距离用于度量组合学习之后的特征相对变化。在多个公开多标签图像数据集上的大量实验结果证明了,线性与非线性标签语义特性建模方式都可以显著的提升多标签图像分类性能,且在大型多标签图像数据集上非线性的建模方式明显优于线性的建模方式。
其他文献
改革开放以来,我国城市化速率不断加快。城市居民在享受社会经济蓬勃发展福祉的同时,也遇到了城市热岛加剧、洪涝灾害频发、生物多样性锐减等问题的困扰。其中,城市生物多样性反映了城市生态系统服务功能状况,直接影响着城市人居环境质量,因而备受国内外关注。城市化过程中的生境破碎化问题是导致生物多样性锐减的主要原因之一。科学构建城市生态网络,是应对城市生境破碎化、促进城市生物多样性恢复的重要手段。城乡规划、风景
学位
城市形态的干预被广泛认为是缓解城市热岛效应的主要措施之一,然而现有研究还缺乏多尺度城市形态的热环境绩效系统评估。本文基于卫星遥感影像、统计年鉴、Google Earth和WUDAPT等数据,通过SPSS和Amos等分析软件,依次从宏观尺度(我国266个地级市)——中观尺度(3个火炉城市:重庆、武汉和南京)——微观尺度(重庆市渝中区)系统探究了城市形态与热环境之间的作用关系及背后的潜在机制。主要结论
学位
历史街区公共空间是承载城市文化与公众交往的重要场所,在历史街区历经了物质静态更新、过度商业化、同质化更新等诸多困境后,近年来,国内历史街区进行了以“文化活动”驱动发展的诸多实践,重庆因其独特的地理文化环境和运营方式,在社交媒体上备受关注,并表现出了片段化和符号化的景观,暴露出城市更新中街区公共生活被消费文化和网红活动侵占而产生碎片化和符号化的现象和问题。从空间生产视角来看,当空间和文化作为资本,具
学位
随着城市化的进程,“退二进三”的工业转型策略在不断推行,城区中的工厂陆续关停搬迁。在工厂退出城市发展的历史舞台之际,曾经依属工厂而建、见证生产兴衰的工人村在这一浪潮中留存下来,但由于与工厂依属关系弱化、生产支撑消退,呈现出与城市发展步调错位的局面,所面临的内外矛盾日渐突显。重庆作为长江上游的经济中心和历史悠久的老工业城市,工人村建设量大面广,成为了重庆城市空间的重要组成部分,也侧面见证了重庆工业发
学位
如何在快速城镇化进程中引导城镇空间合理的发展已经成为当前亟待解决的问题之一。城镇急剧扩张带来的各类社会矛盾的积累,最终在城镇中以各种自然灾害、人为灾害以及各种不确定的风险显现,导致城镇空间的脆弱性和敏感性加剧。同时随着城镇化的进一步加速,我国的城镇化格局发生了重大变革,这种深刻的变化将带来我国乡镇发展模式的巨变,对未来一段时间内我国乡镇的规划建设也产生着巨大影响。当前我国开始积极推行国土空间规划体
学位
随着我国综合国力的不断提升,近年来承办奥运会、世博会、亚运会等重大事件的频率也呈上升趋势。借助举办契机,城市宣传传统文化与地域文化、提升城市环境品质、强化城市的文化形象,已成为城市打造其国际形象的重要途径。京张高铁作为2022冬奥会配套服务专线,是展示中国现代科技与历史文化的重要窗口,因此如何秉承“绿色、共享、开放、廉洁”的办奥理念,打造富涵中国特色、代表中国名片的京张站前广场是冬奥系列配套服务建
学位
自然不仅是城市的生态基底,也是构成城市特色的重要要素。山作为最主要的自然要素之一,既是人居环境中的地理标志与文化标志,更是文化认同、精神信仰、地域文明传承的重要载体。中国是一个多山国家,在传统城市的规划和营建过程中,“以山为根本”、“以山为精神”的思想深植于对城市山地环境本底的考察实践,形成了众多“城-山”融合的城市风景形态,凝结了丰富的“城-山”风景营建智慧。在当前快速城市化的进程中,城市建设与
学位
实时操作系统(Real-time Operating System,RTOS)在诸多重要应用领域有着广泛的使用,尤其在嵌入式设备中,RTOS提供了资源调度和协调任务运行的能力。由于嵌入式设备的资源受限的特点以及RTOS的实时性要求,一些安全技术,特别是密码技术在这些设备中的应用会对系统造成影响,而传统的RTOS密码测评大多通过测量真实的运行数据判断可行性(指加密算法应用后系统是否能保持正常运行的性
学位
近红外光谱分析技术具有分析速度快、无损、可在线检测、多组分同时分析等优点,有效解决了传统原油分析方法耗时长、样品消耗量大的问题,在石化行业发挥着重要作用。然而传统的光谱分析方法容易受到光谱中噪声的影响,导致预测性能不佳。基于深度学习的光谱分析模型对带有噪声的光谱数据具有较好的预测稳定性,但存在冗余参数多、训练需要的样本量大、可解释性差等缺点。因此,本文研究基于深度学习的原油近红外光谱分析新方法,目
学位
由于患脑卒中等伴有肢体功能障碍疾病的人群日渐增多且呈年轻化趋势,肢体障碍康复问题值得研究者关注。现常见的肢体康复治疗方案需要在医院或是康复中心的辅助下进行,而疫情期间患者无法及时地在医院进行康复治疗,导致在社区和家庭进行肢体康复训练治疗的需求激增。综上,远程康复治疗对解决患有肢体障碍疾病的人群实现居家康复是具有意义的。可穿戴传感器可以利用微电子和通信技术实现康复治疗的远程监控且能测量多项人体生理和
学位