采用神经网络的亲属识别关键问题研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:chao120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
亲属关系识别作为图像处理、计算机视觉研究中的一项有趣兼具挑战性的分支,在寻找失踪儿童、构建家庭相册、社交媒体分析、图片自动标注等众多领域中都具有潜在的应用价值。近年来亲属关系识别研究得到了学术界广泛的关注并取得了长足的进步。基于图像处理的亲属识别算法一般包含两个模块:特征提取和亲属分类。这两个阶段通常是分离的,提取出来的特征可能对于分类任务并不具备一定的判别性,与此同时,单个特征对于亲属图像的特征表示不够充分。为了解决以上问题,本文首先提出一种采用神经网络的端对端学习模型,即将特征提取和分类阶段融合起来构成一个任务驱动型的网络,同时加入新的损失函数对特征进行约束。其次,为了建立更具判别力的亲属特征表示,本文提出一种基于多特征融合的神经网络模型,即对多种特征进行融合优化。具体概述如下:(1)本文提出采用角度损失神经网络的亲属识别算法。该算法基于卷积神经网络提取目标图像对的深度特征,不同于提取传统手工设计的特征,本算法通过基于任务学习的端对端神经网络学习分类判别性强的特征,使得目标的信息表示更加丰富。此外,我们在算法中增加了角度损失函数,使其对处理分类时非亲属之间面部特征很相像的问题更加鲁棒。通过采用角度损失函数将用于分类的特征从欧式空间映射到超球体上,这更符合人脸位于非线性流形域上的分布,同时通过参数的限制使得类内距离更小,类间距离更大,学习到更具判别性、更有利于亲属关系分类的特征,通过在多个亲属识别数据集上的实验结果验证了本算法的有效性。(2)本文接着提出了一种基于多特征融合神经网络的亲属识别算法。该算法对多个特征提取器提取到的人脸特征进行深层次的非线性融合,从而得到具有丰富信息、更鲁棒的亲属识别特征。特征提取器可以是传统的人工设计的低层特征,也可以是深度神经网络获取到的高层特征,其中每个特征对于解决亲属识别中的某一类问题比较有效,如光照、姿势变换等。通过神经网络的全连接层和非线性激活层可以有效的融合多个特征的相似性和互补性,使得神经网络学习到融合各个特征,不同层次的通用丰富语义特征,并且在多个亲属识别数据集上的实验结果验证了本算法的有效性。
其他文献
目的:通过将目标导向液体治疗(Goal-Directed Fluid Therapy,GDFT)联合右美托咪定(Dexmedetomidine,DEX)应用于断指再植手术中,观察联合应用对断指再植手术患者的血乳酸、血糖、血流动力学、Ramsay镇静评分及术中不良事件的临床效果观察。方法:选择2018年8月至2019年12月,三峡大学附属仁和医院手外科行断指再植手术患者100例。根据随机数法将100
城市品牌可以展现出城市的软实力,悄无声息的对外界展示城市的风貌。在全球化的今天,加强城市的综合竞争力,需要积极发展城市硬实力,同时塑造城市的软实力,而城市品牌的塑造,恰恰就成为一种增强城市竞争力的重要手段。西安作为十三朝古都,历史底蕴深厚,最近几年西安在城市品牌塑造中迎头赶上,通过一系列整合营销传播手段积极的塑造城市品牌,达到了预期的城市品牌整合营销传播效果,并通过成功的节事活动、营销活动使城市品
当前我国各地区间电网的主网络线路主要是由220 k V输电线路构成的,该电压等级的输电线路担当着各地方电能输送的主要任务,其可靠性直接关系到电能输送的稳定性和安全性。复杂的地理环境和极限气候条件对220k V输电线路的正常运行造成了诸多威胁,也极大地增加了线路维护的难度,甚至导致人员伤亡。随着网络信息技术的快速发展,“互联网+”已成为各行各业创新发展的平台,输电线路的安全隐患主要是因对线路走廊的监
近年来,随着各国之间的交流不断加强,口译活动扮演着愈发重要的角色。与此同时,一些语言类专家也投入到口译活动的研究。其中,法国著名口译教授丹尼尔·吉尔在认知科学的基础上提出了“精力分配模型”。他将交替传译分为听力理解和译语输出两个阶段,为现阶段的口译实践提供了重要指导。本文以作者在IBM全球志愿者服务队银川站项目中的口译实践为例,以“精力分配模型”为理论依据,分析了作者在口译活动中影响其精力分配的因
党的十九大提出,要构建全面统一、权威高效、全面覆盖的监督体系。国有企业管理和运行的有序关乎国家经济命脉的稳定,而对其领导和工作人员权力进行监督制约则是能够使国有企业保持平稳有序健康发展的关键方式。纪检监察履行对国企监督职能是将国有企业权力关进制度笼子里的关键,也是保障国有资产生产经营活动有序开展的重要制度保障。派驻监督是中国特色党内监督的重要形式,作为党委、纪委设在派驻部门的监督“前哨”和“探头”
过去二十年来的研究表明,氧化还原介体可以加速偶氮染料、高氯酸盐、砷酸盐、Cr(Ⅵ)及四氯化碳等的厌氧生物转化。在某些情况下,氧化还原介体的存在甚至是反应进行的必要条件
深度神经网络已成为计算机视觉及人工智能领域的研究重点。目前,在图像分类、语义分割等任务中,已有相关研究通过使用不同结构的人工神经网络获得了良好的表现。然而,在训练过程中,一些超参数的选择,如学习率,会对模型的精度产生较大影响,较大的学习率会使模型很难收敛而较小的学习率又会导致训练耗费较长时间。在继往的研究中,学习率的选择往往依赖经验,使得训练效率下降。同时,在优化神经网络时往往使用反向传播算法使梯
Skyline查询是指从多维数据集中筛选出不被其他任何数据点支配的数据点,是一种重要的数据分析方法。目前分布式数据集上的skyline查询分为水平分布数据集上的skyline查询和垂
烷基胺化合物是一种重要的化工原料,广泛应用于医药、农业、染织业等领域。通过半导体光催化胺和醇的N-烷基化反应来制备烷基胺受到了越来越多的关注,这种合成方法具有反应条件温和可控,原料来源广泛,副产物较少等优点。通过对胺和醇的N-烷基化反应机理研究可以为氨基聚醚的光催化合成提供更多的理论支撑。为本实验以金属盐为前驱体,以二氧化钛(P25)为光活性载体,采用光化学沉积法制备了一系列P25负载金属粒子的光
相比于传统光纤,由于光子晶体光纤(photonic crystal fiber,PCF)特殊结构致使其拥有许多非常优异的光学特性,比如可控色散特性、高阶非线性、无截止单模特性等,也为非线性光