图文联合的新闻图像人脸标注技术研究

来源 :战略支援部队信息工程大学 | 被引量 : 1次 | 上传用户：DUOFIPAUT8E

【摘要】

：

新闻中的图像常含有人脸,对应文本中常含有图中人脸的姓名。图文联合的新闻图像人脸标注的任务是利用这样的新闻图像-文本数据集学习一个人脸标注模型,为未知的新闻图像中的

【作者】

：

征察

【出处】

：

战略支援部队信息工程大学

【发表日期】

：

2018年01期

【关键词】

：

新闻图像人脸标注鲁棒主成分分析成对约束多模态信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

新闻中的图像常含有人脸,对应文本中常含有图中人脸的姓名。图文联合的新闻图像人脸标注的任务是利用这样的新闻图像-文本数据集学习一个人脸标注模型,为未知的新闻图像中的人脸标注姓名。它是新闻内容自动分析、新闻聚合等领域的支撑技术,具有广阔的应用前景。当前图文联合的新闻图像人脸标注通常包含三个关键步骤:预处理、人脸消歧和训练人脸标注模型。预处理负责从原始的新闻图像-文本数据集中提取人脸和姓名,得到弱标记人脸数据集;人脸消歧是求解出弱标记人脸数据集中人脸和姓名的对应关系,得到强标记人脸数据集;训练人脸标注模型是利用强标记人脸数据集训练标注模型。尽管现有研究取得了丰硕的成果,但在预处理、人脸消歧和训练人脸标注模型中仍存在一些不足,主要体现如下:(1)图像中有时会含有一些没有分析价值的背景人脸,它们会对人脸消歧造成干扰,但现有预处理方法缺乏对消除背景人脸的研究;(2)现有消歧算法对人脸间的约束关系利用不足,通常只利用了相似人脸具有相同姓名的约束,缺乏对差异较大的人脸具有不同姓名的约束的利用;(3)在训练人脸标注模型过程中,现有方法通常只利用人脸相似度信息,对有助于人脸标注的其他多模态信息利用不充分。本文针对以上问题展开研究,主要工作如下:(1)针对背景人脸干扰的问题,提出一种基于鲁棒主成分分析的背景人脸消除算法,在预处理步骤中增加背景人脸消除环节,删除弱标记人脸数据集中的背景人脸。本文基于弱标记人脸数据集中背景人脸是离群点的假设,通过度量人脸的离群程度来检测背景人脸。具体地,首先对数据集进行采样获得多个训练子集;然后结合鲁棒主成分分析算法,利用每个训练子集训练一个背景人脸基检测器来独立地度量人脸离群程度,并将所有基检测器的度量结果相加作为人脸的最终离群程度;最后,将离群程度偏高的人脸判断为背景人脸并消除。在公开新闻图像人脸数据集上的实验结果表明该方法相对基准检测算法具有更好的背景人脸检测效果,从而可以更彻底地消除背景人脸。(2)针对现有人脸消歧算法对人脸间约束利用不足的问题,提出了基于成对约束的人脸消歧算法。该算法同时利用了相似的人脸具有相同的姓名、差异较大的人脸具有不同的姓名这两种约束。首先,研究了新闻人脸数据中广泛存在的数据不平衡现象对低秩表示算法的影响,推导出该情况下人脸间低秩表示系数表示人脸相似度的方式,并根据人脸相似度推导出人脸间的约束关系;之后,基于人脸间的成对约束建立了表达成对约束的图模型,通过最小化基于图模型的能量函数进行人脸消歧。在公开的新闻图像人脸数据集上的实验结果表明,所提方法具有较好的人脸消歧准确率。(3)针对训练人脸标注模型时通常只利用人脸相似度信息,而对其他有利于人脸标注的多模态信息利用不足的问题,提出了基于多模态信息融合的人脸标注算法。该算法首先提取了包括基于人脸相似度的人脸姓名匹配度、人脸大小、人脸位置、人脸清晰度和姓名位置等多模态信息,然后结合人脸消歧后的强标记人脸数据集训练基于多模态信息融合的人脸标注模型。在公开新闻图像人脸数据集上的实验结果表明多模态信息的利用有助于人脸标注模型效果的提升,相对于只利用人脸相似度的标注模型具有较好的标注准确率。

其他文献

支持快速跳频的数字下变频研究与实现

面对日益复杂的通信环境,现代无线通信要求通信系统具有更好的通用性和抗干扰性。软件无线电技术使得通信系统具有良好的通用性,所以其在现代无线通信中发挥着更加重要的作用

学位

软件无线电快速跳频数字下变频三步旋转CORDIC算法多相滤波加法树

锌指蛋白Zfpm家族在斑马鱼心脏发育中功能的研究

心脏是脊椎动物胚胎发育过程中第一个形成并发挥作用的器官,而心脏病具有高发病率和高致死率,严重危害人类健康。研究表明先天性心脏病多与心脏基因的异常转录有关。其中左室

学位

斑马鱼Zfpm心脏发育心室小梁化神经调节蛋白-ERBB信号通路

烧结烟气恒温复合循环余热回收技术应用

结合分析国内烧结低温余热回收存在的问题,文章介绍烧结烟气恒温复合循环余热回收技术特点,为用户烧结余热回收提供一种高效且可靠的解决方案。

期刊

烧结余热回收烟气恒温复合循环

北京明长城分布现状及其损毁保护的研究

本论文利用计算机遥感自动解译，人工遥感解译和地学相关分析法，调查北京明长城分布现状及其周围村庄、土地利用情况。将北京明长城按其自然分段划分为87个长城段落，通过解译建立

学位

北京明长城遥感分布损毁保护带

活性氩弧焊对钛合金焊缝成形的影响

配制应用多组元成分的活性剂，对钛合金TC4进行A-TIG焊，并对其焊接接头的宏观和微观形貌进行了分析研究。结果表明：在相同工艺参数条件下，活性剂成分对焊缝成形有明显影响。

期刊

活性剂A-TIG焊钛合金焊缝成形

苛化法制烧碱Na2CO3溶液最佳浓度问题

<正> 苛性钠（烧碱）为一重要化工原料。在工业用碱日益增加的情况下,许多乡镇企业,因陋就简,就地取材,用冰碱（Na2CO3·10H2O）采用苛化法制烧碱。但采用何种浓度的Na2CO3溶液进行苛

期刊

溶度积常数氢氧化钙溶解度Na2CO3石灰乳最佳浓度

合作原则视角下情景剧《好汉两个半》中的言语幽默研究

幽默研究的第一次记录可以追溯到柏拉图和亚里士多德时代。随着研究的发展,幽默从各个角度提供了一套综合性的描述,包括人类学,社会学,美学,文学,心理学,语言学等等。西方学

学位

情景喜剧合作原则言语幽默

高效液相色谱法测定慕萨莱斯中儿茶素含量

建立了高效液相色谱法测定慕萨莱斯中儿茶素含量。采有ZORBAX 80A Extend-C18(4.6 mm×150 mm,5μm);流动相:V(甲醇)∶V(1%乙酸水溶液(pH 3))=10∶90;流速:1.0 mL/min;柱温:3

期刊

慕萨莱斯高效液相色谱法儿茶素

基于动态博弈的车网互动策略研究

电动汽车数量逐年增加,数量庞大的电动汽车接入电网,将会对电网的安全性和稳定性产生巨大的影响。通过合理的充放电电价引导电动汽车群体响应电网的需求,为车网双方带来收益,

学位

车网互动策略动态博弈放电电价放电电量

《长夜：威廉·夏伊勒和〈第三帝国的兴亡〉》出版

本报记者康慨报道一部回顾美国记者和历史学家威廉·夏伊勒（1904-1993）及其名著《第三帝国的兴亡》的新书，刚刚由麦克米伦公司在美国出版。$$　　《第三帝国的兴亡》于196

报纸

图文联合的新闻图像人脸标注技术研究

与本文相关的学术论文