基于GNN的新闻配图物体关系发现机制研究

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:scarllie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,网络已经成为人们日常生活中必不可少的一部分。人们获取新闻时事的主要渠道已经由传统的纸质版媒介转化为以互联网为载体的网络新闻。通常一则网络新闻包括描述时事的新闻文本和直观反映时事的新闻配图。然而有些不良媒体为了谋取高的新闻流量、迎合读者的猎奇心理,刻意给新闻配以与新闻内容无关但很吸引人的配图。如果不及时检测此类新闻,会浪费读者的时间精力、使公众对事实产生误解、误导社会舆论走向,从而破坏网络新闻生态。因此甄别图文不匹配的网络新闻已成为当下亟需解决的社会问题。近年来利用图像描述进行图文匹配性检测的方法取得了一定的进步。然而新闻文本中存在大量的命名实体,现有图像描述方法并不能直接生成带有命名实体的新闻配图描述,这导致新闻文本与新闻配图描述之间存在巨大的语义差异,无法直接使用现有方法检测新闻的图文匹配性。一些研究工作尝试了为图像生成带有命名实体的描述方法,但是缺少分析新闻场景中命名实体之间的关联,因此常常会导致生成的描述中实体关联关系错误。为解决上述问题,提出了基于GNN的新闻配图物体关系发现机制研究,主要工作和创新点如下所述:第一,为了使用新闻的相关文章扩充新闻配图的背景知识,本文构建了TopNews新闻数据集。与其他的新闻数据集不同的是,TopNews新闻数据集中既包含新闻的配图和文本,也包含新闻的相关文章。此外,本文为TopNews数据集人工标注了新闻的图文匹配性,为后续构建新闻知识图谱、分析实体间关联提供了基础。第二,为了准确地发现新闻场景中命名实体之间的关联,本文构建了新闻知识图谱来准确地在新闻场景中刻画命名实体之间的关联,为后续分析实体之间的关联奠定基础。第三,为了分析新闻知识图谱中命名实体之间的全部关联,本文给出了新闻知识图谱驱动的图神经网络(News Knowledge Graph Driven Graph Neural Network,NKD-G NN)。该网络在提取新闻知识图谱的表示向量时,分析了新闻知识图谱中实体间的关联。第四,本文在TopNews新闻数据集上进行了验证。实验结果表明,本文的方法可以有效的甄别新闻的图文匹配性。
其他文献
学位
学位
随着管道服役年限增加,管道失效情况严重。管壁的腐蚀、漏洞、穿孔等失效形式,会造成管内介质外泄,引发安全事故,故需要对管道进行定期巡检。采用管道机器人新技术可以有效克服传统检测手段中作业困难、效率低、成本高等问题。现有管道机器人管径适应范围小,爬坡能力较弱,运动方式单一,运行效率低。针对以上问题,设计一种可以变化运动方式的管道机器人。论文主要研究内容如下:首先,结合机器人的工况环境,得出设计需求;对
随着现代工业化速度加快,越来越多的行业都在采用焊接构件,因此对焊接构件的安全性提出了更高的要求。近年来将超声波应用于材料和冶金领域逐渐成为重要研究方向,超声振动施加于焊接烙池来改善焊接质量越来越引起行业内的关注。本课题将视觉跟踪机器人与超声技术相结合,应用于焊接领域,设计了一种全方位移动超声空化机器人控制系统,可实现在焊接时机器人通过视觉反馈随焊行走,保证超声波始终作用于焊接熔池,使凝结后的焊缝组
平绥铁路是由中国完全自主设计建造的首条铁路,线路修筑18年,全长800余公里,经历了清朝和民国两个历史时期,是中国工程技术史上浓墨重彩的一笔。其不仅以代表中国当时铁路工程技术的最高水平而载入史册,还留有一批数量可观、种类丰富、价值较高的铁路建筑遗产,这些建筑分散于旧时的铁道两旁,向过往的旅人诉说着其背后的历史故事与象征意义。本文所研究的内蒙古地区平绥铁路建筑,特别是站房建筑与京张段的铁路建筑呈现出
准确判别交通道路拥堵情况以及根据未来时刻的路况提供最优的行驶路径对缓解交通拥堵、提高市民出行效率、提升居民幸福指数均具有重要意义。随着智能交通系统(Intelligent Traffic System,ITS)的发展,交通流预测、车速预测、路况预测等问题逐渐成为研究热点。针对目前交通路况预测研究中存在的单因素无法准确表征交通路况、聚类算法不具备对未来路况的预测能力、所用机器学习算法模型参数寻优和测
近些年,随着合成孔径雷达(SAR)成像技术快速的发展,在海洋舰船目标检测领域,SAR技术已经可以提供较成熟且语义信息丰富的高分辨率SAR图像。其中,目标检测是SAR图像解译中的焦点部分,为海洋监测与海防事业的建设提供了强有力的技术支撑。本文基于深度学习目标检测技术,重点研究了不同SAR图像舰船特征下深度学习算法的检测性能,旨在寻求相适应的算法且提升检测性能,提高检测的精准率与可信度,具体研究内容如
蛋白质是组成人体一切细胞、组织的重要成分,是新陈代谢和细胞生命活动的主要承担者。而蛋白质功能的实现离不开配体的参与,蛋白质只有与配体结合形成稳定的复合物才能实现它的生理功能,金属离子是一种相当重要的蛋白质结合配体,影响着人体中诸多必要的生理进程。因此,对蛋白质-金属离子配体结合位点的预测具有重要意义,这不仅能够完善人类对蛋白质功能实现过程的认识,也有助于从细胞和分子水平上为重大疾病的诊断、预防和治
缠绕工艺是当前复合材料制备应用较为广泛的一项制造技术。凭借在筒形类基础构件制造中的独特优势,在航空、航天等高科技领域中得到广泛应用。复合材料缠绕制品的性能不仅取决于材料自身,更取决于成型过程中工艺参数的选取与控制。如果工艺参数的控制较差,会导致制品难以达到所需的性能要求,最终影响成型制品的力学性能。因此,对复合材料缠绕过程中工艺参数进行精准控制,有利于保证缠绕制品的力学性能。首先,论文从预浸带缠绕
随着我国经济的快速增长,不同地区之间的合作越来越多,民族间交流越来越多。蒙古语是我国蒙古族使用的语言,实现蒙古语到汉语之间的翻译对民族间共同发展起到举足轻重的作用。现阶段,蒙汉机器翻译效果不够显著,原因在于,蒙汉翻译模型是端到端模型,其在训练时是以带有标注的对齐数据进行训练,而推理时是根据模型自身的预测进行推理,存在训练与推理不统一的问题;同时也存在着交叉熵损失函数与BLEU值的评价级别不一致问题