基于多属性和上下文的社会关系推理

来源 :天津大学 | 被引量 : 0次 | 上传用户:pscc33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当我们看一张图像时,便会很自然地联想图中人物间的关系,这能为人物性格以及可能将采取的行为提供线索。在计算机视觉领域,社会关系信息也大有用处,可被用于提高其他任务准确率,如人物轨迹预测、多目标跟踪等。目前该领域工作大部分都是针对特定场景的,因为社会关系的复杂性为通用场景下社会关系识别的完备性及准确性带来挑战。本文工作就是一种通用的社会关系识别方法。现如今,已有的相关工作还存在以下两个问题:忽略不同人物属性对社会关系识别的不同影响;未综合考虑人物以及上下文语义线索。为解决以上问题,本文做了如下两个工作:(1)针对忽略属性线索对识别的不同影响这一问题,提出了基于人物多属性的社会关系识别模型。它分别从人物对图像中提取人物对语义属性特征、社会关系特征,再利用基于低秩双线性池化的注意力机制学习到的不同人物属性对社会关系的注意力系数来融合人物属性特征和社会关系特征,将其输入到SOFTMAX分类器得到社会关系识别结果。(2)针对未综合考虑人物及上下文语义线索这一问题,提出了基于多属性和上下文的社会关系推理模型。它在第一个工作基础上还引入了基于上下文的社会关系推理模型,该推理过程是通过GGNN模型实现的。首先根据先验知识构建语义物体与不同社会关系的知识图结构,再将从给定图像上提取到的背景物体特征和社会关系特征初始化图中对应节点,再根据GGNN模型前向传播规则进行信息传播和融合得到所有节点输出特征,引入注意力机制以社会关系为维度分别融合该社会关系节点和相邻语义物体节点输出特征,将融合后的特征依次输入到SOFTMAX分类器得到所有社会关系上的得分,最后将该得分与第一个工作得到的得分进行融合,从而推理出社会关系。本文实验数据集是PIPA-relation数据集,该数据集标签是等级结构的(关系域-关系)。因此本文实验把在All Class划分下域识别m AP、关系识别m AP分别作为粗粒度关系识别、细粒度关系识别的性能指标。除此之外,本文实验也在去除某一社会关系的训练集上训练模型(该数据集划分被称为Single Relation数据集划分),然后计算在测试集上的的关系域识别m AP,将其作为度量方法泛化性能的指标。由实验结果可知,本工作方法在粗粒度关系识别性能、泛化性能相较于其他工作有了一定提高。本工作也为其他基于语义线索的社会关系识别工作提供了参考,具有良好的扩展性和应用性。
其他文献
随着经济的发展和工业化进程的加快,挥发性有机物(Volatile Organic Compounds,VOCs)的排放量急剧增加。严重威胁着人类和环境。吸附技术因由于其具有易于操作、灵活、有效和低成本的等特点在VOCs处理技术中尤为突出。其中多孔碳吸附剂应用更为广泛,可以由化石燃料、生物质和其他富含碳的原料生产得到。生物质作为可再生原料,具有高含碳量和低成本的特点,逐渐被作为制备活性碳的优良原料。
学位
高分辨率、宽视场的正射影像是影像地图的基础数据,可用于林业、气象、水利、规划等政府部门。随着人工智能的发展,无人机由于具有响应能力强、飞行高度低、时效性和性价比高等优势成为正射影像采集的主力军。但因无人机飞行能量限制,如果不进行合理的路径规划,则会降低正射影像采集的效率。本文以无人机正射影像高效、集约采集为应用背景,对限定条件下的无人机区域覆盖问题进行研究探索,寻找一条能够让无人机平滑跟踪且能量最
学位
当今常用的谣言检测模型受人为因素的影响,难以挖掘信息的潜在特征。推文中图片内容的占比越来越大,如果忽略图片信息,仅从文本角度很难全面检测推文的可靠性。本文针对当今谣言检测方法的缺陷,提出基于多模态和深度学习的Twitter谣言检测模型。主要工作和成果包括:(1)本文提出了一种基于深度学习的BLSTM-CNN谣言检测模型。该模型由双向LSTM和多核CNN组合构成,通过它来挖掘谣言文本的潜在特征。首先
学位
随着我国税务征管方式的日臻前沿,互联网时代对企业税务风险管理工作提出了更高的要求。尤其是集团型企业,规模的不断扩张的同时税收管理风险也在同步提升。本文从集团型企业税务风险的特征出发,剖析了风险形成的原因,并提出了具体对策。在全新的"大数据"税务生态环境下,只有集团化税务管理的有效落地才能降低税务管理类风险的发生。
期刊
房地产企业需根据法律法规要求缴纳税款,享有权利的同时履行义务,在税负政策的支持下稳健营运。税务风险与房地产企业未能深入解析税负政策及轻视税务管理等有关,目前税务风险管理作为企业风险管理分支,受到了房地产企业的重视。文章探索了房地产企业税务风险管理的难点及措施,以期提高房地产企业营运综合管理质量。
期刊
本论文研究的内容是基于语音和人脸图像跨模态生成方法的研究,包含两个任务。第一个任务是从语音重建人脸,第二个任务是人脸图像的个性化语音合成。对于语音重建人脸任务,在本文中,设计了一种基于编码器-解码器结构模型,并将残差先验信息的思想引入模型,提出一种基于注意力的残差先验语音重建人脸模型,该模型将面部先验特征与语音特征合并,送入人脸特征解码器以形成最终的人脸图像。本文提出一种联合损失函数,该函数是L2
学位
自2018以来,越来越多的6mA位点相关数据被发现。同时6mA位点的识别也开始受到越来越多学者的关注。6mA位点的识别在生物信息学领域具有重大的意义。目前,越来越多的6mA位点识别的方法被提出来。其中,大多数学者都采用到了机器学习的方法来识别6mA位点并且都取得了不错的效果。但是,相比于众多的数据和物种,仍然需要更多的计算方法来进行识别。目前多数传统的机器学习或者深度学习方法都只在单一物种上有效。
学位
随着近些年来物联网(IoT)和云计算的蓬勃发展,密码安全也愈发显得重要。公钥密码体制无疑作为最受业界青睐的密码体制之一,也为广大密码学者及科研人员尤其关心的对象。对现存在有的相关密码算法实现侧信道攻击,有助于了解该密码算法的安全性和不足之处,有助于对该算法进行详细的评估,在原有算法基础上增加更有效防护策略,使得该密码算法更具备抗攻击性。本文针对盲化Boscher RSA加密算法,在SASEBO-G
学位
区块链为数据的安全可信存储提供了不以人的意志为转移的技术保障。传统区块链系统为了满足数据安全与去中心化的设计要求,将全量数据存储在所有的全节点,并通过分布式共识机制来实现数据更新操作以及全局一致性视图,从而消除中心化架构的弊端和信任问题。然而,随着区块链系统的运行,全节点的规模以及数据的体量都会越来越大,这将不可避免的带来巨大的数据冗余和节点存储压力。因此,区块链存储可扩展性方案的均衡设计成为一项
学位
物体计数是密集计数任务的拓展,是对图像或者视频中感兴趣的物体进行数目统计。基于物体计数的研究可以分为两类:基于检测的物体计数和基于回归的物体计数。基于检测的物体计数方法预估物体数目通常远远小于真实物体数目。基于密度图估计的回归方法由于输出的密度图保存了物体的空间信息,从而能够对密集小物体实现接近真实数目的计数,但是这种方法由于缺乏物体的位置信息,不能如目标检测一样定位到每个实例,失去可靠性,限制了
学位