【摘 要】
:
近年来,随着共享网站(如微博、微信、Facebook等)的快速发展,日益增长的多媒体数据(包括图像、视频等)已经成为当今社会记录、表达和传递信息的主要媒介。如何使计算机能够高效准确得理解这类数据的语义内容,已经成为计算机视觉领域的主流研究方向。其中,图像的特征学习,尤其是如何提取更具有判别性的图像特征,作为实现大多数视觉子任务的一项关键基础研究,受到了广泛研究者的关注。现有的特征学习方法通常关注于
论文部分内容阅读
近年来,随着共享网站(如微博、微信、Facebook等)的快速发展,日益增长的多媒体数据(包括图像、视频等)已经成为当今社会记录、表达和传递信息的主要媒介。如何使计算机能够高效准确得理解这类数据的语义内容,已经成为计算机视觉领域的主流研究方向。其中,图像的特征学习,尤其是如何提取更具有判别性的图像特征,作为实现大多数视觉子任务的一项关键基础研究,受到了广泛研究者的关注。现有的特征学习方法通常关注于图像中的直观特征,未能充分挖掘并利用各对象及特征间的结构关系。因此,为提高对数据内容的理解程度,本文将图像的结构信息嵌入到特征学习中,并以不同的视觉分析子任务(场景识别、图像生成、人脸聚类)作为研究点。本文重点研究不同形式的图像结构信息,针对每个子任务设计了一系列对应的学习模型,来提升各个子任务的处理性能。本文的主要创新性研究成果总结如下:1.本文考虑语义层次结构,受启发于现实世界中对象具有层次结构,并利用层次结构这一特性,着重研究对场景识别任务的影响。现有基于图像表示的场景识别算法无法描述图像更丰富的含义,为此,本文提出了基于高维特征表示的场景识别模型。该模型预先构建了一个新的数据字典,其中包含了特征名词(场景对象)、形容词(场景颜色)、动词(场景特征)。此外,模型中引入多标签类别概念,将每个特征看作一个类别,多类预测将输出多个具有语义层次结构特征,同时,为保证特征具有更丰富的判别性,预测得出的每个特征均对应一个概率值。即,一副图像经过模型后,得到与词汇表对应的图像特征概率向量。图像特征向量中的每个特征具有不同的概率值,在多个基准场景数据集的实验结果表明,提出的模型性能明显优于主流的图像表示方法。2.为了弥补卷积操作的局部性,本文进一步考虑了图像内的几何结构,同时受启于图像中复杂的几何轮廓存在长距离依赖特性。本文融合这一特性,着重研究仿妆人脸图像生成这一图像生成的子任务上。生成的仿妆人脸图像需保留仿妆者的身份信息的同时妆容尽可能地与目标者相同。本文提出了基于协同注意力机制的新型生成对抗网络模型,该模型在生成器中引入了协同注意力机制,该机制利用同一序列内所有位置来计算序列中某个位置的响应,对人脸图像区域中长距离、多层依赖关系进行建模,来学习图像中的几何结构信息,实现实例级别的仿妆学习。同时,为增强判别性,本文在真伪判别器的基础上,额外引入了一个妆容风格鉴别器。为了生成任意妆容且更精确的人脸图像,本文还构建了一个仿妆人脸数据集。在本文提出的仿妆人脸数据库及公开的人脸数据库上大量的实验的量化指标证明了,本文提出的模型可生成质量更高的仿妆人脸图像。3.为了弥补整体数据结构信息的缺失,本文考虑数据集的全局拓扑结构,受启于同一身份的图像之间存在关联关系。本文着重研究人脸聚类这一人脸识别任务中的基础问题。人脸聚类的目标是,将无标签人脸数据划分为不同的簇(不同身份)。为学习图像级全局拓扑关系,本文提出了一种基于全图学习的人脸聚类算法。该算法首先根据设计的加权相似性对数据库中的所有图片进行构图。然后,利用构建的图模型学习图中顶点间的关联关系。模型将人脸聚类问题转化为一个新边的预测问题,即通过确定两张人脸图片之间是否存在边连接,进而判定两张图片是否隶属同一个簇(身份)。为直接学习图像间的关系,模型将图中顶点与其邻接的候选集之间的关系进行编码,并作为连接(边)属性进行学习。为验证提出算法的有效性,本文分别在4个基准数据集上对提出的算法和经典聚类算法、基于图卷积神经网络的聚类算法进行对比。实验结果显示,提出的算法在不同数据集上均有良好的聚类效果并优于主流算法。
其他文献
微/纳米机器人(MNR)是一种具有微/纳米结构,可以将环境中能量转化为机械能,实现自主运动的一类活性载体。其中磁场驱动微纳米机器人由于采用非接触的磁场力驱动其运动,具有生物相容性高,且离子耐受力强,能够适应更加复杂的环境等优点,在未来体内应用有着巨大的潜力。作为一种可操作的平台,磁场驱动微纳米机器人凭借可控的运动特性,在生化传感方面显示出优势,为革新传统的生化传感方法提供了替代策略。本文主要研究磁
可穿戴电子产品的迭代更新促进了柔性能源存储器件的快速发展,其中柔性超级电容器和柔性水系锌离子电池在可穿戴电子产品储能方面有着广泛的应用前景。然而对于高能量密度柔性储能器件而言,制备出具有容量高和工作寿命长的柔性电极材料是制造柔性能源存储与转换器件的关键。而目前制备高容量和电化学性能优异的柔性电极材料仍面临着一些挑战,如活性材料负载量低、材料堆积造成离子扩散缓慢以及制备柔性电极方法复杂、条件苛刻,严
对羟基苯甲酸酯(Parabens)具广谱抗菌性被作为防腐剂广泛应用,其中对羟基苯甲酸乙酯(Ethylparaben,EP)作为食品添加剂应用最为普遍。由于对羟基苯甲酸酯的大量生产使用,其对环境的污染及生物体的暴露已是一个世界性的安全问题。结合国内外研究现状,已有大量文献报道对羟基苯甲酸酯可影响生物体生殖系统及神经发育,但对人类健康影响的许多问题仍未得到解释。经本课题组前期转录组学分析,首次发现EP
【背景】恐惧记忆(fear memory)是对刺激、情景及结果的联想学习能力,是一种强烈、持久的记忆形式。其相关研究通常以巴甫洛夫条件性恐惧(Pavlovian fear conditioning)模型为基础。恐惧记忆消退是指在不呈现非条件性刺激的情况下反复接触无害的条件性刺激,会导致条件性恐惧反应逐渐减少。恐惧记忆消退是暴露疗法的基础,后者是创伤后应激障碍、焦虑症以及压力相关疾病的主要治疗方法。
习近平主席于2020年9月22日,在第七十五届联合国大会一般性辩论上,庄严地宣布“中国二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和。”~1“基于碳中和目标的人造板产业动态生命周期模型及碳收支评估”博士学位论文是达成这一战略目标的方法学研究成果。同时也是国家社科基金重点项目“应对气候变化的中国林业国家碳库构成与预警机制研究”分支课题的研究报告。人造板产业作为中国林业产业的支
全球能源需求的日益增长,化石资源储量的逐渐枯竭,国际低碳排放的环保要求以及化石燃料应用导致的环境污染等因素,使得开发环境友好可再生的生物质燃料迫在眉睫。木本油脂和废弃油脂等非食用油脂由甘油三酯组成,具有良好的流动性、较高的能量密度以及与化石燃料相似的化学结构,是制备生物质燃料的优良选择。因其粘度较高,而不适合直接用作内燃机燃料。热解与酯交换技术可以有效降低其粘度,并将油脂转化为生物油和生物柴油。但
青钱柳(Cyclocarya paliurus)是我国特有的单种属的多功能树种,集药用、材用以及保健价值与一身。青钱柳叶片中富含酚类、萜类和多糖等多种活性物质,以其叶片为主要原料开发的食品、药品、保健品备受关注。为满足市场需求,加强原料林培育与开发利用已成为推动青钱柳产业发展的重要举措。由于我国土地资源紧张,滨海盐碱地资源丰富,为发展青钱柳人工林的潜在土地资源。然而,关于青钱柳耐盐机制仍不明晰。因
随着量子信息技术和深空探测等领域的蓬勃发展,对能有效工作于2 K及以下极低温区的低温制冷机提出了日益迫切需求。在各类低温制冷机中,以氦为工质的多级制冷机预冷Joule-Tomson(JT)复合制冷循环是实现2 K及以下极低温区制冷的有效手段,特别是以回热式多级高频脉冲管制冷机与间壁式JT制冷机相耦合的复合制冷机,其在常温端采用高可靠、长寿命线性压缩机作为驱动源,冷端结构紧凑且无任何运动部件,具有高
背景及目的:简易爆炸装置和高速高能武器的频繁使用,军、警在平暴、反恐和战争等行动中都可能遭受高速冲击作用引起的创伤性颅脑损伤(Traumatic brain injury,TBI)。高速爆炸破片和弹丸引起的颅脑穿透伤,损害严重、伤亡率高,易识别;但爆炸作用下的冲击伤,特别是轻型颅脑爆炸冲击伤(blast-induced mild Traumatic brain injury,bmTBI),隐匿性强