跨年龄人脸识别技术在声像档案管理中的应用研究

来源 :档案与建设 | 被引量 : 0次 | 上传用户:jkhy66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:声像档案是记录社会发展的重要档案,但是目前声像档案保管、利用模式未能充分发挥出声像档案的真正价值。将跨年龄人脸识别技术应用到声像档案管理过程中,可提高声像档案检索利用的准确率,对应用画像识别技术开展其他档案管理发挥积极作用。文章基于跨年龄人脸识别技术优势和特点,分析其在档案管理领域的应用前景。
  关键词:年龄;人脸识别技术;声像档案;档案管理
  大数据、人工智能等计算机技术的快速普及推动了传统的档案管理利用向档案数字化、信息化方向转变。随着声像档案种类不断丰富以及数量急剧增加,其管理利用的难度呈指数级增长,声像档案如何高效管理利用的问题急需解决[1]。本文结合声像档案智慧人脸识别系统技术优势,阐述跨年龄人脸识别技术在档案领域的应用场景,并对跨年龄人脸识别技术进行探究,以便提高声像档案识别精准度。

一、人脸识别技术概要


  人脸中包含大量的视觉特征,具有难以复制的特点,人脸识别技术对这些视觉特征进行提取并进行比对,从而确定人物的身份信息。该技术包括人像跟踪、红外检测、图像自动生成等,应用了图形和人工智能等最新技术[2]。人脸识别过程分为人脸图像检测、人脸跟踪定位和人脸身份比对三个步骤,具体过程为首先判断图片或视频中是否存在人像,跟踪人像目标并确认检测到的人像身份特征,然后依次将采集到的人像与人像数据库中的人像信息进行比较,直到找到最佳匹配对象[3]。
  人脸识别技术探究主要分为三个阶段,初期主要通过几何特征对人脸特征进行提取和识别,中期以代数特征为人脸识别依据,现阶段主要依靠机器学习以及深度学习方法提取人脸特征进行人脸识别,其识别的精准度和准确率越来越高,跨年龄人脸识别也取得了良好进展。

二、人脸识别技术应用概况


  1. 人脸识别技术应用领域
  目前人脸识别技术已广泛应用于身份验证、刑事侦察、信息安全等领域。[4](使用场景见表1)这些领域的人脸识别大部分是对人脸几何特征的识别,即通过即时拍摄的脸部照片比对身份证或早期录制的脸部图像,进而分析脸部特征信息与原有数据信息,比对通过后进行身份确认。
  2. 跨年龄人脸识别技术需求
  人脸经过时间推移会发生变化,给人脸验证造成困难。在公安司法采信和身份验证领域,存在大量多年前的肇事逃逸案件,肇事者在逃逸后往往只留下当时的照片,经过多年后图片中人物的实际外貌会发生变化,无疑给人脸验证造成了很大干扰。在实际应用中,考虑使用跨年龄的人脸识别技术可以减少证件更换频率,降低成本。在刑事领域利用跨年龄人脸识别技术对逃逸者图像进行比对,无疑会为遗留案件的办理提供新的思路,提高办案效率。

三、跨年龄人脸识别技术应用于声像档案管理的优势分析


  1. 声像档案管理现状
  在声像档案管理的过程中,经常出现年龄增长后样貌差别较大,通过人工比对的方式难以识别的问题。例如,企业编制某领导的纪念册用于记录其突出贡献,但由于档案照片库中的档案信息涉及人物众多,时间跨度大,不同人以及同一个人不同时间的样貌都存在着不小的差异。工作人员一一比对图片之间的差异,费时费力,还无法保证查找的准确率。
  在档案管理过程中,由于声像档案动态性的特征,相比于常见的静态照片档案更不易于查找并利用。档案工作人员在检索声像档案视频内容时,为了保证不遗漏,往往需要逐帧浏览整个视频,这样的过程需要耗费大量的人力物力,同时也无法高效准确地对声像档案内容进行检索与利用。
  许多学者积极探索将人工智能技术用于实际的档案管理利用,其中便涉及人脸识别技术,不过这些研究大多没有考虑人脸识别技术在声像档案中的利用。[5]同时,在现有的数字化档案管理领域,使用的绝大部分档案人像识别方法都是传统的人脸识别算法,未考虑年龄因素带来的影响,识别精度低、效果并不理想。
  2. 跨年龄人脸识别技术在声像档案管理中的应用前景
  人脸识别技术难点:首先是在进行人脸图像采集时,人脸图像受背景、光照等环境条件以及拍摄的角度、姿态等人为因素影响造成识别精度较低。其次是声像档案库中画像年代久远,时间跨度大,随着人的容貌发生变化,长得相似的人易判断混淆,造成识别效率偏低。
  经过几十年的发展,人脸识别中动态特征识别和静态特征识别技术已越来越成熟,跨年龄人脸识别技术就是为了提高检索的精度,将因时间推移人脸发生变化的照片也能准确检索出来,进一步提高声像档案检索效率。
  第一,对馆藏声像档案进行分类建库。以档案馆馆藏人物声像档案检索应用为例,管理人员可以基于OpenCV开源项目实现人脸检测识别,建立重要人物图像数据库。通过数据库对档案馆馆藏人物声像档案进行挖掘利用,通过人脸的特征值对含有人物的照片以及视频进行分类,对出现过该人物的所有声像档案内容[6]进行归纳整理,建立完整的人物数据库。
  第二,开展远程在线查询身份验证。在档案安全管理领域,过去人脸识别技术的使用场景多是档案库房门禁管理系统,用于保障档案库房的安全[7]。目前则被广泛用于在線档案查询中,利用者需要在线拍摄头像上传验证身份,才能完成查询申请。
  第三,声像档案检索。许多馆藏的声像档案缺乏详细的文字说明,若利用传统的文字检索声像档案,效率不高。跨年龄人脸识别技术为声像档案检索利用提供了技术途径,即通过一张已有的照片与馆藏海量照片库比对智能识别,将需要的照片检索出来。

四、跨年龄人脸识别技术应用于声像档案管理系统的案例


  1. 智能人像检索系统
  声像档案智能人像检索系统是南京理工大学针对校友返校检索本人在校期间照片的互动应用场景,将跨年龄人脸识别技术应用于档案检索中的成功案例。在档案馆或校史馆的迎宾机上开发利用人像查找档案图片的功能,即声像档案智能人像检索系统。通过现场实时采集校友人像,与照片档案库中的人像进行比对,成功检索到该校友的照片后,返回存有用户照片的档案记录,再经艺术处理加工后呈现。   系统使用B/S架构,并集成到迎宾机档案公共查阅大系统中。分前台与后台,前台完成系统入口、人像采集、照片匹配、档案信息查阅、照片打印、留言评价等;后台完成管理员登录注册、人像检索、用户端管理、系统设置、修改密码等。功能模块如图1所示。
  2. 智能人像檢索系统的技术分析



  智能人像检索系统中通过人脸识别实现档案查阅模块是核心功能模块。为了满足跨年龄人脸识别的要求,保证跨年龄人脸识别的精准度,该系统设计了改进的跨年龄人脸识别算法。
  如果使用大规模的人脸特征提取网络收集数据并训练模型,学习到的深层人脸特征必然包含身份相关成分(如种族、性别)和身份无关成分,而档案人像因为时间跨度较大,所以身份无关成分会造成较大的类内差异,影响识别精度。声像档案中应用人脸识别技术的理想目标是:尽可能减少人脸老化过程中面部特征信息造成的人员自然信息与法定注册信息匹配性不一致的状况。解决这一技术难题的主要技术方案是:对声像档案中人像照片的年龄与身份信息进行标注,采用一种能够提取年龄影响因素潜在因子(Latent Identity Analysis)的联合深度卷积神经网络(Convolutional Neural Networks)作为人脸特征提取网络(Latent Identity Convolutional Neural Networks,LI-CNN),使用该特征提取网络来挖掘深层人脸特征,如人类骨骼结构、手脉体温等关键识别因素,这些深层人脸特征是不因年龄衰老而改变的。
  如图2,LI-CNN模型由两个关键部分组成:用于卷积特征学习的卷积单元和用于深度特征学习的全连接层。模型使用两部分对两个并行的网络进行训练,第一部分使用卷积层对只带身份标签的数据进行学习,在获得带有年龄标签的人脸数据后,先使用有五个卷积核的卷积层提取人脸区域的普遍特征,将全连接层参数固定,只更新卷积层参数,最后联合使用softmax loss和contrastive loss损失函数进行优化;第二部分主要研究如何使用全连接层进行学习,标注了带有年龄和身份标签的档案人脸照片数据,定义人脸特征中随年龄发生变化的部分为隐身份因子,在对隐身份因子学习时,通过潜在同一性分析方法对人脸特征分离使用梯度下降方法更新模型中的隐身份因子,学习相关的参数。经过这两个部分的不断耦合学习,最终从人脸的全部特征中去除隐身份因子的影响,获得随年龄不发生变化的特征。
  系统分前台用户模块与后台管理员模块。前台包含人像采集功能模块、人脸特征匹配模块、档案查阅模块、照片打印模块以及评价与留言模块。后台包含管理员登录注册模块、人像检索模块、检索记录模块、照片库更新模块、档案上传模块、查看照片库模块、系统管理模块、管理员管理模块。另外系统还实现了一个基于retinaface模型的应用于嵌入式设备的人脸检测模块。



  3. 智能人像检索系统创新点及实验分析
  使用深浅层特征融合和迁移学习以及联合学习的方法解决跨年龄人脸识别问题,并且将其用于声像档案人像识别领域,设计并实现了一个声像档案人像检索系统。该系统主要创新如下。
  (1)搜集并标注了档案跨年龄人像测试数据集,在档案测试集上进一步验证了特征融合算法的有效性。



  (2)开发了一种联合多任务学习的方法,使用年龄有序回归预测任务与身份分类任务以及特征去相关性分析任务共同更新参数。在提取到融合的多层次人脸特征后,通过年龄有序回归预测任务提取人脸年龄特征,之后将年龄特征通过全连接层线性映射为人脸特征中随衰老产生变化的年龄因子,从面部全局特征中减去年龄影响因子即获得随面部衰老稳定的人脸身份特征,最后把随年龄衰老稳定的人脸身份特征应用于档案人像识别中。
  在档案人像测试数据集上的实验中,我们提取了689对人脸样本,每个样本包含两张不同年龄的人脸照片,采用OE-CNN方法[8]作为对比试验,识别精确度的评价指标为Rank1精确度,实验结果如表2所示。
  从实验结果可以看到,本文提出的特征融合方法在档案跨年龄人像测试集上的效果与OE-CNN方法相比提升了3.6%。根据实验结果结合档案人像的特点分析,本文提出的特征融合的方法,在存在年龄差异同时还包含光照、图像像素质量低等干扰的档案人像识别中,可以提取到比其他现有方法更丰富、多层次的人脸稳定特征,在档案照片领域的适用性更强。



  在声像档案管理中使用跨年龄人脸识别技术,可显著提高各类声像档案资源精准查找及综合利用能力,满足档案工作者以及用户的更深层需求,为政府和大众提供更高效、优质的声像档案资源利用服务。
  随着现代计算机网络信息处理技术的进一步快速发展,各类声像档案信息化业务管理的标准体系趋于健全,规章制度不断完善,利用移动互联网、大数据及跨年龄人脸识别等新一代信息技术,可实现面向智慧信息化的各类声像档案业务管理。
  *本文系2017年度江苏省高校哲社基金项目“社会诚信体系构建中的个人信用档案建立与服务研究”(项目编号:2017ZDIXM090)阶段性研究成果。
  注释与参考文献
  [1]张鹏.数字化声像档案管理系统的设计与实现[D].电子科技大学,2014.
  [2][4]何春.人脸识别技术综述[J].智能计算机与应用,2016(5):112-114.
  [3]方军,汤进军.人脸识别技术应用于声像档案整理工作探析[J].黑龙江档案,2020(3):24-25.
  [5]胡湖.基于人脸识别的照片档案挖掘利用架构[A].国家档案局档案科学技术研究所.档案管理与利用——方法技术实践[C].国家档案局档案科学技术研究所,2013:5.
  [6]李宁.人脸识别技术在个人电子档案管理中的应用[J].北京档案,2020(10):29-31.
  [7]冯瑞文.人工智能在档案管理中应用初探[J].黑龙江档案,2020(3):95.
  [8]Y.Wang,D.Gong,Z.Zhou,X.Ji,H.Wang,Z.Li,W.Liu,andT.Zhang. Orthogonal Deep Features Decomposition for Age-Invariant Face Recognition[C]. In European Conference on Computer Vision(ECCV),2018.
其他文献
摘 要:文章从一个学科概念的命名及演进角度,梳理了从唐代刘知几“制册章表书”到清代章学诚“比次之书”——对档案文献编纂成果概念或名称的认知从无到有、从具象到抽象的不断深化过程。档案学界公认章学诚是中国古代档案文献编纂思想的集大成者。刘知几的档案文献编纂思想是章学诚系统、成熟、完整的档案文献编纂思想必不可少的基础。随着社会转型与信息技术的发展,档案馆服务受众由小众向大众转型,当代的档案文献编纂、编研
摘 要:有关1928年4月15日在上海法租界出席台共成立大会的中共中央代表“彭荣”之真实身份,学界围绕“彭湃说”与“任弼时说”至今仍有不少争论。笔者在日共早期领导人佐野学档案中发现了一则新材料,其明确记载出席会议的中共中央代表在莫斯科曾以“布林斯基(Бринcкий)”为名。而中共领导人里使用过该名的只有任弼时。笔者认为,此次日文档案中的新发现,结合若干年前俄罗斯学者公布的大会亲历者林木顺写给共产
举办大型国际体育赛事成为增强主办城市综合实力的重要手段。该研究采用文献资料法、逻辑分析法及访谈法,围绕第七届军运会对武汉城市形象的影响而展开。通过概述第七届军运会举办的理论基础,分析武汉成为第七届军运会举办方的原因,针对第七届军运会提升武汉城市形象进行分析,从基础设施建设、城市投资和消费、区域经济发展、城市社会平安指数和城市品牌形象与国际地位5个方面进行阐述。
摘 要:我国现行人事档案管理模式已经不能适应大数据时代人事档案事业发展的需求。文章从形成背景、本土化意义和实践基础等方面论述了文件连续体理论本土化的可行性,主张基于文件连续体理论创新我国人事档案管理模式,建立全国人事档案信息中心,并提出智慧化人事档案馆的设想。  关键词:人事档案管理模式;文件连续体理论;本土化  《全国档案事业发展“十三五”规划纲要》(以下简称“十三五”规划)中明确提出要“实现以
1937年7月7日,日本帝国主义者以制造卢沟桥事变为起点,悍然发动全面侵华战争,至同年冬,苏南东路各地相继沦陷。由于国民党基层政权的大小官吏早就闻风而逃,置百姓安危于不顾,苏南各地陆续陷入无政府状态。1938年春夏间,待局势稍稍缓和,地方上的国民党政权渐次复活,但因实力有限而畏敌如虎,只能流动隐伏于远离县城的偏僻乡镇,成为“地下县政府”。这些县政府控制区极小,仅能在所在地附近的几个乡、村活动。它们
随着社会经济及科技的飞速发展,人类的发展也进入到了一个新的阶段。目的:将健身气功引入学校的教学之中,改善大学生心理健康问题。方法:以问卷调查为主,采集并整理数据。结果:大学生进行健身气功锻炼之后,心理状态更为健康。结论:健身气功对大学生心理健康调节具有积极作用。
健身瑜伽作为一项健身运动对改善亚健康有其独特的作用。该文针对都市白领人群亚健康的改善和预防,采用文献资料、实验对比、数据统计等方法分析了健身瑜伽的特点和都市白领人群亚健康现状,结合呼吸法、体位法、冥想法研究了健身瑜伽对亚健康的改善和预防机理、方法和效果。结果表明,健身瑜伽能有效改善亚健康,显著提升练习人群的身体和心理健康水平。
手球运动是一项起源于欧洲的球类运动,是集田径、篮球、足球、橄榄球等技术特点为一体的激烈的同场对抗运动,我国手球运动也取得了辉煌的成绩。部分省市高校和中小学的手球运动也在全面开展,不但加深了学生对竞技手球运动的了解,而且提高了自身的身体素质,培养了终身体育的意识,该文对幼儿园开展“小手球”运动的可行性进行探究,发现问题,并提出发展策略,为我国手球运动的全面普及开展提供理论支持。
摘 要:建国初期,社會上大量存在的各种有害图书危害了人民群众的身心健康和社会主义改造事业的推进,大力清理各类有害图书、力促民众阅读健康图书成为一项势在必行的任务。从1955—1956年的广西地方档案来看,这场图书清理运动经过了充分的宣传动员,运用了丰富的工作方法,既查禁、收换了大量有害图书,又对旧书摊进行了组织化的集中管理,使其经营方式发生了重要转变。  关键词:有害书刊;社会主义改造;出版整顿;
摘 要:东汉末年的广陵太守陈登续修邗沟,使大运河最早的一段——古邗沟得以恢复生命力,方便了江淮之间水上交通,促进了江淮地区经济的发展。陈登所开凿的邗沟西道成为东汉以后江淮之间的主要运河线路。隋代利用邗沟西道,建成了贯通南北的隋唐大运河。  关键词:陈登;邗沟;东汉;大运河;陈公塘;捍淮堰  春秋时期,吴王夫差开凿了连通长江与淮河的邗沟,这成为中国大运河最早的河段。到了东汉末年,由于河道淤塞,古邗沟