论文部分内容阅读
摘 要:声像档案是记录社会发展的重要档案,但是目前声像档案保管、利用模式未能充分发挥出声像档案的真正价值。将跨年龄人脸识别技术应用到声像档案管理过程中,可提高声像档案检索利用的准确率,对应用画像识别技术开展其他档案管理发挥积极作用。文章基于跨年龄人脸识别技术优势和特点,分析其在档案管理领域的应用前景。
关键词:年龄;人脸识别技术;声像档案;档案管理
大数据、人工智能等计算机技术的快速普及推动了传统的档案管理利用向档案数字化、信息化方向转变。随着声像档案种类不断丰富以及数量急剧增加,其管理利用的难度呈指数级增长,声像档案如何高效管理利用的问题急需解决[1]。本文结合声像档案智慧人脸识别系统技术优势,阐述跨年龄人脸识别技术在档案领域的应用场景,并对跨年龄人脸识别技术进行探究,以便提高声像档案识别精准度。
人脸中包含大量的视觉特征,具有难以复制的特点,人脸识别技术对这些视觉特征进行提取并进行比对,从而确定人物的身份信息。该技术包括人像跟踪、红外检测、图像自动生成等,应用了图形和人工智能等最新技术[2]。人脸识别过程分为人脸图像检测、人脸跟踪定位和人脸身份比对三个步骤,具体过程为首先判断图片或视频中是否存在人像,跟踪人像目标并确认检测到的人像身份特征,然后依次将采集到的人像与人像数据库中的人像信息进行比较,直到找到最佳匹配对象[3]。
人脸识别技术探究主要分为三个阶段,初期主要通过几何特征对人脸特征进行提取和识别,中期以代数特征为人脸识别依据,现阶段主要依靠机器学习以及深度学习方法提取人脸特征进行人脸识别,其识别的精准度和准确率越来越高,跨年龄人脸识别也取得了良好进展。
1. 人脸识别技术应用领域
目前人脸识别技术已广泛应用于身份验证、刑事侦察、信息安全等领域。[4](使用场景见表1)这些领域的人脸识别大部分是对人脸几何特征的识别,即通过即时拍摄的脸部照片比对身份证或早期录制的脸部图像,进而分析脸部特征信息与原有数据信息,比对通过后进行身份确认。
2. 跨年龄人脸识别技术需求
人脸经过时间推移会发生变化,给人脸验证造成困难。在公安司法采信和身份验证领域,存在大量多年前的肇事逃逸案件,肇事者在逃逸后往往只留下当时的照片,经过多年后图片中人物的实际外貌会发生变化,无疑给人脸验证造成了很大干扰。在实际应用中,考虑使用跨年龄的人脸识别技术可以减少证件更换频率,降低成本。在刑事领域利用跨年龄人脸识别技术对逃逸者图像进行比对,无疑会为遗留案件的办理提供新的思路,提高办案效率。
1. 声像档案管理现状
在声像档案管理的过程中,经常出现年龄增长后样貌差别较大,通过人工比对的方式难以识别的问题。例如,企业编制某领导的纪念册用于记录其突出贡献,但由于档案照片库中的档案信息涉及人物众多,时间跨度大,不同人以及同一个人不同时间的样貌都存在着不小的差异。工作人员一一比对图片之间的差异,费时费力,还无法保证查找的准确率。
在档案管理过程中,由于声像档案动态性的特征,相比于常见的静态照片档案更不易于查找并利用。档案工作人员在检索声像档案视频内容时,为了保证不遗漏,往往需要逐帧浏览整个视频,这样的过程需要耗费大量的人力物力,同时也无法高效准确地对声像档案内容进行检索与利用。
许多学者积极探索将人工智能技术用于实际的档案管理利用,其中便涉及人脸识别技术,不过这些研究大多没有考虑人脸识别技术在声像档案中的利用。[5]同时,在现有的数字化档案管理领域,使用的绝大部分档案人像识别方法都是传统的人脸识别算法,未考虑年龄因素带来的影响,识别精度低、效果并不理想。
2. 跨年龄人脸识别技术在声像档案管理中的应用前景
人脸识别技术难点:首先是在进行人脸图像采集时,人脸图像受背景、光照等环境条件以及拍摄的角度、姿态等人为因素影响造成识别精度较低。其次是声像档案库中画像年代久远,时间跨度大,随着人的容貌发生变化,长得相似的人易判断混淆,造成识别效率偏低。
经过几十年的发展,人脸识别中动态特征识别和静态特征识别技术已越来越成熟,跨年龄人脸识别技术就是为了提高检索的精度,将因时间推移人脸发生变化的照片也能准确检索出来,进一步提高声像档案检索效率。
第一,对馆藏声像档案进行分类建库。以档案馆馆藏人物声像档案检索应用为例,管理人员可以基于OpenCV开源项目实现人脸检测识别,建立重要人物图像数据库。通过数据库对档案馆馆藏人物声像档案进行挖掘利用,通过人脸的特征值对含有人物的照片以及视频进行分类,对出现过该人物的所有声像档案内容[6]进行归纳整理,建立完整的人物数据库。
第二,开展远程在线查询身份验证。在档案安全管理领域,过去人脸识别技术的使用场景多是档案库房门禁管理系统,用于保障档案库房的安全[7]。目前则被广泛用于在線档案查询中,利用者需要在线拍摄头像上传验证身份,才能完成查询申请。
第三,声像档案检索。许多馆藏的声像档案缺乏详细的文字说明,若利用传统的文字检索声像档案,效率不高。跨年龄人脸识别技术为声像档案检索利用提供了技术途径,即通过一张已有的照片与馆藏海量照片库比对智能识别,将需要的照片检索出来。
1. 智能人像检索系统
声像档案智能人像检索系统是南京理工大学针对校友返校检索本人在校期间照片的互动应用场景,将跨年龄人脸识别技术应用于档案检索中的成功案例。在档案馆或校史馆的迎宾机上开发利用人像查找档案图片的功能,即声像档案智能人像检索系统。通过现场实时采集校友人像,与照片档案库中的人像进行比对,成功检索到该校友的照片后,返回存有用户照片的档案记录,再经艺术处理加工后呈现。 系统使用B/S架构,并集成到迎宾机档案公共查阅大系统中。分前台与后台,前台完成系统入口、人像采集、照片匹配、档案信息查阅、照片打印、留言评价等;后台完成管理员登录注册、人像检索、用户端管理、系统设置、修改密码等。功能模块如图1所示。
2. 智能人像檢索系统的技术分析
智能人像检索系统中通过人脸识别实现档案查阅模块是核心功能模块。为了满足跨年龄人脸识别的要求,保证跨年龄人脸识别的精准度,该系统设计了改进的跨年龄人脸识别算法。
如果使用大规模的人脸特征提取网络收集数据并训练模型,学习到的深层人脸特征必然包含身份相关成分(如种族、性别)和身份无关成分,而档案人像因为时间跨度较大,所以身份无关成分会造成较大的类内差异,影响识别精度。声像档案中应用人脸识别技术的理想目标是:尽可能减少人脸老化过程中面部特征信息造成的人员自然信息与法定注册信息匹配性不一致的状况。解决这一技术难题的主要技术方案是:对声像档案中人像照片的年龄与身份信息进行标注,采用一种能够提取年龄影响因素潜在因子(Latent Identity Analysis)的联合深度卷积神经网络(Convolutional Neural Networks)作为人脸特征提取网络(Latent Identity Convolutional Neural Networks,LI-CNN),使用该特征提取网络来挖掘深层人脸特征,如人类骨骼结构、手脉体温等关键识别因素,这些深层人脸特征是不因年龄衰老而改变的。
如图2,LI-CNN模型由两个关键部分组成:用于卷积特征学习的卷积单元和用于深度特征学习的全连接层。模型使用两部分对两个并行的网络进行训练,第一部分使用卷积层对只带身份标签的数据进行学习,在获得带有年龄标签的人脸数据后,先使用有五个卷积核的卷积层提取人脸区域的普遍特征,将全连接层参数固定,只更新卷积层参数,最后联合使用softmax loss和contrastive loss损失函数进行优化;第二部分主要研究如何使用全连接层进行学习,标注了带有年龄和身份标签的档案人脸照片数据,定义人脸特征中随年龄发生变化的部分为隐身份因子,在对隐身份因子学习时,通过潜在同一性分析方法对人脸特征分离使用梯度下降方法更新模型中的隐身份因子,学习相关的参数。经过这两个部分的不断耦合学习,最终从人脸的全部特征中去除隐身份因子的影响,获得随年龄不发生变化的特征。
系统分前台用户模块与后台管理员模块。前台包含人像采集功能模块、人脸特征匹配模块、档案查阅模块、照片打印模块以及评价与留言模块。后台包含管理员登录注册模块、人像检索模块、检索记录模块、照片库更新模块、档案上传模块、查看照片库模块、系统管理模块、管理员管理模块。另外系统还实现了一个基于retinaface模型的应用于嵌入式设备的人脸检测模块。
3. 智能人像检索系统创新点及实验分析
使用深浅层特征融合和迁移学习以及联合学习的方法解决跨年龄人脸识别问题,并且将其用于声像档案人像识别领域,设计并实现了一个声像档案人像检索系统。该系统主要创新如下。
(1)搜集并标注了档案跨年龄人像测试数据集,在档案测试集上进一步验证了特征融合算法的有效性。
(2)开发了一种联合多任务学习的方法,使用年龄有序回归预测任务与身份分类任务以及特征去相关性分析任务共同更新参数。在提取到融合的多层次人脸特征后,通过年龄有序回归预测任务提取人脸年龄特征,之后将年龄特征通过全连接层线性映射为人脸特征中随衰老产生变化的年龄因子,从面部全局特征中减去年龄影响因子即获得随面部衰老稳定的人脸身份特征,最后把随年龄衰老稳定的人脸身份特征应用于档案人像识别中。
在档案人像测试数据集上的实验中,我们提取了689对人脸样本,每个样本包含两张不同年龄的人脸照片,采用OE-CNN方法[8]作为对比试验,识别精确度的评价指标为Rank1精确度,实验结果如表2所示。
从实验结果可以看到,本文提出的特征融合方法在档案跨年龄人像测试集上的效果与OE-CNN方法相比提升了3.6%。根据实验结果结合档案人像的特点分析,本文提出的特征融合的方法,在存在年龄差异同时还包含光照、图像像素质量低等干扰的档案人像识别中,可以提取到比其他现有方法更丰富、多层次的人脸稳定特征,在档案照片领域的适用性更强。
在声像档案管理中使用跨年龄人脸识别技术,可显著提高各类声像档案资源精准查找及综合利用能力,满足档案工作者以及用户的更深层需求,为政府和大众提供更高效、优质的声像档案资源利用服务。
随着现代计算机网络信息处理技术的进一步快速发展,各类声像档案信息化业务管理的标准体系趋于健全,规章制度不断完善,利用移动互联网、大数据及跨年龄人脸识别等新一代信息技术,可实现面向智慧信息化的各类声像档案业务管理。
*本文系2017年度江苏省高校哲社基金项目“社会诚信体系构建中的个人信用档案建立与服务研究”(项目编号:2017ZDIXM090)阶段性研究成果。
注释与参考文献
[1]张鹏.数字化声像档案管理系统的设计与实现[D].电子科技大学,2014.
[2][4]何春.人脸识别技术综述[J].智能计算机与应用,2016(5):112-114.
[3]方军,汤进军.人脸识别技术应用于声像档案整理工作探析[J].黑龙江档案,2020(3):24-25.
[5]胡湖.基于人脸识别的照片档案挖掘利用架构[A].国家档案局档案科学技术研究所.档案管理与利用——方法技术实践[C].国家档案局档案科学技术研究所,2013:5.
[6]李宁.人脸识别技术在个人电子档案管理中的应用[J].北京档案,2020(10):29-31.
[7]冯瑞文.人工智能在档案管理中应用初探[J].黑龙江档案,2020(3):95.
[8]Y.Wang,D.Gong,Z.Zhou,X.Ji,H.Wang,Z.Li,W.Liu,andT.Zhang. Orthogonal Deep Features Decomposition for Age-Invariant Face Recognition[C]. In European Conference on Computer Vision(ECCV),2018.
关键词:年龄;人脸识别技术;声像档案;档案管理
大数据、人工智能等计算机技术的快速普及推动了传统的档案管理利用向档案数字化、信息化方向转变。随着声像档案种类不断丰富以及数量急剧增加,其管理利用的难度呈指数级增长,声像档案如何高效管理利用的问题急需解决[1]。本文结合声像档案智慧人脸识别系统技术优势,阐述跨年龄人脸识别技术在档案领域的应用场景,并对跨年龄人脸识别技术进行探究,以便提高声像档案识别精准度。
一、人脸识别技术概要
人脸中包含大量的视觉特征,具有难以复制的特点,人脸识别技术对这些视觉特征进行提取并进行比对,从而确定人物的身份信息。该技术包括人像跟踪、红外检测、图像自动生成等,应用了图形和人工智能等最新技术[2]。人脸识别过程分为人脸图像检测、人脸跟踪定位和人脸身份比对三个步骤,具体过程为首先判断图片或视频中是否存在人像,跟踪人像目标并确认检测到的人像身份特征,然后依次将采集到的人像与人像数据库中的人像信息进行比较,直到找到最佳匹配对象[3]。
人脸识别技术探究主要分为三个阶段,初期主要通过几何特征对人脸特征进行提取和识别,中期以代数特征为人脸识别依据,现阶段主要依靠机器学习以及深度学习方法提取人脸特征进行人脸识别,其识别的精准度和准确率越来越高,跨年龄人脸识别也取得了良好进展。
二、人脸识别技术应用概况
1. 人脸识别技术应用领域
目前人脸识别技术已广泛应用于身份验证、刑事侦察、信息安全等领域。[4](使用场景见表1)这些领域的人脸识别大部分是对人脸几何特征的识别,即通过即时拍摄的脸部照片比对身份证或早期录制的脸部图像,进而分析脸部特征信息与原有数据信息,比对通过后进行身份确认。
2. 跨年龄人脸识别技术需求
人脸经过时间推移会发生变化,给人脸验证造成困难。在公安司法采信和身份验证领域,存在大量多年前的肇事逃逸案件,肇事者在逃逸后往往只留下当时的照片,经过多年后图片中人物的实际外貌会发生变化,无疑给人脸验证造成了很大干扰。在实际应用中,考虑使用跨年龄的人脸识别技术可以减少证件更换频率,降低成本。在刑事领域利用跨年龄人脸识别技术对逃逸者图像进行比对,无疑会为遗留案件的办理提供新的思路,提高办案效率。
三、跨年龄人脸识别技术应用于声像档案管理的优势分析
1. 声像档案管理现状
在声像档案管理的过程中,经常出现年龄增长后样貌差别较大,通过人工比对的方式难以识别的问题。例如,企业编制某领导的纪念册用于记录其突出贡献,但由于档案照片库中的档案信息涉及人物众多,时间跨度大,不同人以及同一个人不同时间的样貌都存在着不小的差异。工作人员一一比对图片之间的差异,费时费力,还无法保证查找的准确率。
在档案管理过程中,由于声像档案动态性的特征,相比于常见的静态照片档案更不易于查找并利用。档案工作人员在检索声像档案视频内容时,为了保证不遗漏,往往需要逐帧浏览整个视频,这样的过程需要耗费大量的人力物力,同时也无法高效准确地对声像档案内容进行检索与利用。
许多学者积极探索将人工智能技术用于实际的档案管理利用,其中便涉及人脸识别技术,不过这些研究大多没有考虑人脸识别技术在声像档案中的利用。[5]同时,在现有的数字化档案管理领域,使用的绝大部分档案人像识别方法都是传统的人脸识别算法,未考虑年龄因素带来的影响,识别精度低、效果并不理想。
2. 跨年龄人脸识别技术在声像档案管理中的应用前景
人脸识别技术难点:首先是在进行人脸图像采集时,人脸图像受背景、光照等环境条件以及拍摄的角度、姿态等人为因素影响造成识别精度较低。其次是声像档案库中画像年代久远,时间跨度大,随着人的容貌发生变化,长得相似的人易判断混淆,造成识别效率偏低。
经过几十年的发展,人脸识别中动态特征识别和静态特征识别技术已越来越成熟,跨年龄人脸识别技术就是为了提高检索的精度,将因时间推移人脸发生变化的照片也能准确检索出来,进一步提高声像档案检索效率。
第一,对馆藏声像档案进行分类建库。以档案馆馆藏人物声像档案检索应用为例,管理人员可以基于OpenCV开源项目实现人脸检测识别,建立重要人物图像数据库。通过数据库对档案馆馆藏人物声像档案进行挖掘利用,通过人脸的特征值对含有人物的照片以及视频进行分类,对出现过该人物的所有声像档案内容[6]进行归纳整理,建立完整的人物数据库。
第二,开展远程在线查询身份验证。在档案安全管理领域,过去人脸识别技术的使用场景多是档案库房门禁管理系统,用于保障档案库房的安全[7]。目前则被广泛用于在線档案查询中,利用者需要在线拍摄头像上传验证身份,才能完成查询申请。
第三,声像档案检索。许多馆藏的声像档案缺乏详细的文字说明,若利用传统的文字检索声像档案,效率不高。跨年龄人脸识别技术为声像档案检索利用提供了技术途径,即通过一张已有的照片与馆藏海量照片库比对智能识别,将需要的照片检索出来。
四、跨年龄人脸识别技术应用于声像档案管理系统的案例
1. 智能人像检索系统
声像档案智能人像检索系统是南京理工大学针对校友返校检索本人在校期间照片的互动应用场景,将跨年龄人脸识别技术应用于档案检索中的成功案例。在档案馆或校史馆的迎宾机上开发利用人像查找档案图片的功能,即声像档案智能人像检索系统。通过现场实时采集校友人像,与照片档案库中的人像进行比对,成功检索到该校友的照片后,返回存有用户照片的档案记录,再经艺术处理加工后呈现。 系统使用B/S架构,并集成到迎宾机档案公共查阅大系统中。分前台与后台,前台完成系统入口、人像采集、照片匹配、档案信息查阅、照片打印、留言评价等;后台完成管理员登录注册、人像检索、用户端管理、系统设置、修改密码等。功能模块如图1所示。
2. 智能人像檢索系统的技术分析
智能人像检索系统中通过人脸识别实现档案查阅模块是核心功能模块。为了满足跨年龄人脸识别的要求,保证跨年龄人脸识别的精准度,该系统设计了改进的跨年龄人脸识别算法。
如果使用大规模的人脸特征提取网络收集数据并训练模型,学习到的深层人脸特征必然包含身份相关成分(如种族、性别)和身份无关成分,而档案人像因为时间跨度较大,所以身份无关成分会造成较大的类内差异,影响识别精度。声像档案中应用人脸识别技术的理想目标是:尽可能减少人脸老化过程中面部特征信息造成的人员自然信息与法定注册信息匹配性不一致的状况。解决这一技术难题的主要技术方案是:对声像档案中人像照片的年龄与身份信息进行标注,采用一种能够提取年龄影响因素潜在因子(Latent Identity Analysis)的联合深度卷积神经网络(Convolutional Neural Networks)作为人脸特征提取网络(Latent Identity Convolutional Neural Networks,LI-CNN),使用该特征提取网络来挖掘深层人脸特征,如人类骨骼结构、手脉体温等关键识别因素,这些深层人脸特征是不因年龄衰老而改变的。
如图2,LI-CNN模型由两个关键部分组成:用于卷积特征学习的卷积单元和用于深度特征学习的全连接层。模型使用两部分对两个并行的网络进行训练,第一部分使用卷积层对只带身份标签的数据进行学习,在获得带有年龄标签的人脸数据后,先使用有五个卷积核的卷积层提取人脸区域的普遍特征,将全连接层参数固定,只更新卷积层参数,最后联合使用softmax loss和contrastive loss损失函数进行优化;第二部分主要研究如何使用全连接层进行学习,标注了带有年龄和身份标签的档案人脸照片数据,定义人脸特征中随年龄发生变化的部分为隐身份因子,在对隐身份因子学习时,通过潜在同一性分析方法对人脸特征分离使用梯度下降方法更新模型中的隐身份因子,学习相关的参数。经过这两个部分的不断耦合学习,最终从人脸的全部特征中去除隐身份因子的影响,获得随年龄不发生变化的特征。
系统分前台用户模块与后台管理员模块。前台包含人像采集功能模块、人脸特征匹配模块、档案查阅模块、照片打印模块以及评价与留言模块。后台包含管理员登录注册模块、人像检索模块、检索记录模块、照片库更新模块、档案上传模块、查看照片库模块、系统管理模块、管理员管理模块。另外系统还实现了一个基于retinaface模型的应用于嵌入式设备的人脸检测模块。
3. 智能人像检索系统创新点及实验分析
使用深浅层特征融合和迁移学习以及联合学习的方法解决跨年龄人脸识别问题,并且将其用于声像档案人像识别领域,设计并实现了一个声像档案人像检索系统。该系统主要创新如下。
(1)搜集并标注了档案跨年龄人像测试数据集,在档案测试集上进一步验证了特征融合算法的有效性。
(2)开发了一种联合多任务学习的方法,使用年龄有序回归预测任务与身份分类任务以及特征去相关性分析任务共同更新参数。在提取到融合的多层次人脸特征后,通过年龄有序回归预测任务提取人脸年龄特征,之后将年龄特征通过全连接层线性映射为人脸特征中随衰老产生变化的年龄因子,从面部全局特征中减去年龄影响因子即获得随面部衰老稳定的人脸身份特征,最后把随年龄衰老稳定的人脸身份特征应用于档案人像识别中。
在档案人像测试数据集上的实验中,我们提取了689对人脸样本,每个样本包含两张不同年龄的人脸照片,采用OE-CNN方法[8]作为对比试验,识别精确度的评价指标为Rank1精确度,实验结果如表2所示。
从实验结果可以看到,本文提出的特征融合方法在档案跨年龄人像测试集上的效果与OE-CNN方法相比提升了3.6%。根据实验结果结合档案人像的特点分析,本文提出的特征融合的方法,在存在年龄差异同时还包含光照、图像像素质量低等干扰的档案人像识别中,可以提取到比其他现有方法更丰富、多层次的人脸稳定特征,在档案照片领域的适用性更强。
在声像档案管理中使用跨年龄人脸识别技术,可显著提高各类声像档案资源精准查找及综合利用能力,满足档案工作者以及用户的更深层需求,为政府和大众提供更高效、优质的声像档案资源利用服务。
随着现代计算机网络信息处理技术的进一步快速发展,各类声像档案信息化业务管理的标准体系趋于健全,规章制度不断完善,利用移动互联网、大数据及跨年龄人脸识别等新一代信息技术,可实现面向智慧信息化的各类声像档案业务管理。
*本文系2017年度江苏省高校哲社基金项目“社会诚信体系构建中的个人信用档案建立与服务研究”(项目编号:2017ZDIXM090)阶段性研究成果。
注释与参考文献
[1]张鹏.数字化声像档案管理系统的设计与实现[D].电子科技大学,2014.
[2][4]何春.人脸识别技术综述[J].智能计算机与应用,2016(5):112-114.
[3]方军,汤进军.人脸识别技术应用于声像档案整理工作探析[J].黑龙江档案,2020(3):24-25.
[5]胡湖.基于人脸识别的照片档案挖掘利用架构[A].国家档案局档案科学技术研究所.档案管理与利用——方法技术实践[C].国家档案局档案科学技术研究所,2013:5.
[6]李宁.人脸识别技术在个人电子档案管理中的应用[J].北京档案,2020(10):29-31.
[7]冯瑞文.人工智能在档案管理中应用初探[J].黑龙江档案,2020(3):95.
[8]Y.Wang,D.Gong,Z.Zhou,X.Ji,H.Wang,Z.Li,W.Liu,andT.Zhang. Orthogonal Deep Features Decomposition for Age-Invariant Face Recognition[C]. In European Conference on Computer Vision(ECCV),2018.