基于交叉多模信息的新闻图像人物标识算法

来源 :西北工业大学 | 被引量 : 0次 | 上传用户：musicwen5918

【摘要】

：

随着网络新闻数据量呈爆炸式飞速增长,如何快速有效地从海量数据中检索出需要的新闻信息成为亟需解决的问题。很多网络新闻都与人物(特别是重要人物,例如各国政要)及其活动有

【作者】

：

苏雪平

【出处】

：

西北工业大学

【发表日期】

：

2015年期

【关键词】

：

文本相关性视觉相关性人名语义网络多示例学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络新闻数据量呈爆炸式飞速增长,如何快速有效地从海量数据中检索出需要的新闻信息成为亟需解决的问题。很多网络新闻都与人物(特别是重要人物,例如各国政要)及其活动有关,因此把网络新闻中的图文信息进行关联分析,特别是把网络新闻中的人脸图像(集)与新闻中的人名关联起来进行新闻事件的自动分析和挖掘,成为近年国际上一个前沿性的研究热点。网络新闻中的人脸图像与新闻字幕中的人名间的对应关系往往为多对多关系,使得从这种多对多的对应关系中实现重要新闻人物的自动标识非常困难。本论文研究了基于图像和文本多模信息融合的新闻图像人物自动标识算法,主要研究工作包括:1.针对给定重要新闻人物人名找到相应人脸问题,研究了基于多模序融合的人脸命名算法。在给定人名找新闻图片中对应的人脸问题中,传统文本标识方法存在标签歧义问题,图像标识方法中存在表情、光照、姿势、遮挡等多种因素引起的视觉差异性问题,鉴于人物出现次序对人物正确标识的巨大贡献和作用,提出了一种将新闻图像字幕中人名位置(次序)的文本信息、视觉信息和人脸图像相似度信息进行多模序融合的重要人脸命名算法。在雅虎新闻数据集的实验结果表明,与传统的Berg算法相比,新方法召回率提高了8.9%,查准率提高了43.5%。2.针对给定人脸找到相应人名问题,研究了一种基于改进Max-ED和Imax-ED的人脸标注新算法。给定人脸找到相应人名问题需要手工标注新闻图像中正负包,耗时耗力,本文通过将ED和Iter-ED视频人脸标注算法引入新闻图像人物标注领域,并改进了正/负包分配方法,在降低虚假正包对标注影响的基础上,提出了改进的Max-ED和Imax-ED人脸标注新算法。利用FAN-Large数据集的实验结果表明,新闻图像人脸的正确识别率提高了42.4%。3.针对人名-人脸间一对一关联关系的建立问题,研究了一种基于网络全局信息的人名语义网络人物建立及人物标识算法。考虑到字幕中同时出现的不同人物,在人脸在新闻图片中同时出现的概率较高,为了提高人物自动标识算法的性能,提出了一种基于网络全局信息的人名语义网络建立方法并提出基于该网络的人物标识算法。在雅虎新闻数据集的实验结果表明,与Ozkan[23]算法相比,解决了多种因素降低人脸图像类间距离的问题,查准率提高了22.1%,召回率提高了24%。

其他文献

工笔画中没骨技法的写意精神研究

没骨技法是一种独特的绘画方式,拥有悠久的发展历史,一直遵循我国国画绘画方式所运用到的审美标准。意象表达作为我国国画审美中的审美宗旨,在没骨技法中表现得淋漓尽致。因

期刊

工笔画没骨技法写意精神

生态修复工程效益监测与评价研究

以2001-2003年实施的安义县水土保持生态修复工程为例，在查阅相关文献资料的基础上，采用频度统计分析法与专家集成法，删选并确定了监测指标体系，对项目建设全过程进行了监测并对

期刊

水土保持综合治理效益综合评价

浅谈新课程实施中如何加强学校教研组建设

学校教研组建设是学校教学管理的一个重要课题。当前,新课程改革对学校教研组建设提出了许多新的要求,本文对照新课标分析了学校教研组建设中存在的主要问题,并结合学校实际

会议

新课程管理教研组建设

推动乡村振兴的几个关键问题

乡村振兴发展是决胜全面建成小康社会和建设社会主义现代化国家的重要组成部分，必须在县域经济社会发展的大格局中整体谋划，在农业现代化、农村城镇化、农民职业化“三农三化”

会议

医疗救助立法的必要性和可行性研究

医疗救助立法是医疗救助规范运行的需要,是调节医疗救助各社会关系的需要,是实现依法治国、构建和谐社会的需要。从理论上看,医疗救助作为一项社会保障制度,靠立法强制予以保

期刊

医疗救助必要性可行性medical relief necessity feasibility

日本新泻17m混凝土泵车改造

我所为福州某公司改造一台已使用10年以上的日本新泻17m混凝土泵车。该车除臂架、支腿、底盘外，其余系统及零部件全部损坏，无法使用。根据用户要求，我们制订出如下改造方案： (1)

期刊

动力系统混凝土泵车液压系统伺服控制系统

西南民族地区农业产业结构与风险特征分析

我国西南地区立体气候明显,农业经济形式多样,发展程度相差甚大,民族文化多样,西南民族地区农业产业结构呈现出独有的鲜明特点。从西南地区农业资源区划着手,分析了西南地区

期刊

西南民族地区农业产业结构风险特征

个性化信息推荐中若干关键问题与技术研究

互联网技术的飞速发展与信息网络化趋势的蔓延使得互联网上信息的数量快速膨胀,人们面临着信息过载带来的信息获取方面的困难。如何帮助互联网用户更加有效地获取自己想要的

学位

2000～2016年青藏高原地表反照率时空分布及动态变化

应用MODIS地表反照率产品MCD43C3,结合青藏高原自然带数据、积雪覆盖率和植被指数数据,采用一元线性回归方法分析了2000~2016年青藏高原地表反照率的分布及变化特征,结果表明

期刊

地表反照率时空分布动态变化青藏高原MODIS数据

目前我国资产证券化发展状况和建议

资产证券化能够提高证券市场上资产的流动性,本文通过我国目前资产证券化的发展状况,并从两个传统的资产证券化业务来分析我国目前的证券化发展障碍和原因分析,提出了我国推

期刊

资产证券化信用法律SPV

基于交叉多模信息的新闻图像人物标识算法

与本文相关的学术论文