【摘 要】
:
知识图谱以结构化的形式描述客观世界中的概念、实体及其之间的关系,是一种对海量信息数据进行组织、管理和理解的方式,具有广泛的应用前景。命名实体识别(NER)是构建知识图谱的关键步骤。NER任务需要从非结构化文本中定位命名实体并分类到特定的类别,例如人名、地点和组织机构等。虽然现有的基于神经网络的命名实体模型在部分领域取得了巨大成功,但是存在以下两点明显的不足:一是现有的方法主要关注在非嵌套命名实体识
论文部分内容阅读
知识图谱以结构化的形式描述客观世界中的概念、实体及其之间的关系,是一种对海量信息数据进行组织、管理和理解的方式,具有广泛的应用前景。命名实体识别(NER)是构建知识图谱的关键步骤。NER任务需要从非结构化文本中定位命名实体并分类到特定的类别,例如人名、地点和组织机构等。虽然现有的基于神经网络的命名实体模型在部分领域取得了巨大成功,但是存在以下两点明显的不足:一是现有的方法主要关注在非嵌套命名实体识别任务,而忽视了实体的多层嵌套问题;二是现有的方法主要关注在新闻媒体领域的文本,而在社交媒体短文本领域由于上下文信息不足而性能急剧下降。针对实体的多层级嵌套问题,本文提出了一种基于边界信息的多层级嵌套命名实体识别模型。实体嵌套现在常见于不同领域的数据集中。由于嵌套实体中的词往往含有多个标签,以往的单层序列标注模型无法处理嵌套问题。多层序列标注模型存在严重的层与层之间的错误传播,而穷举片段模型由于缺少边界标签的引导,往往存在大量的边界错误。本文提出的基于边界感知的神经网络模型,通过进行边界检测,模型能够生成边界相关的候选实体区域,这些区域的文本表示被用来进行嵌套实体类别的预测。相比于现有的多层序列标注模型,基于边界感知的神经网络模型需要更小的计算资源,同时能减缓多层模型中的错误传播,从而达到更好的预测效果。针对社交媒体短文本的实体识别问题,本文提出了一种基于对抗训练和双线性注意力机制的多模态命名实体识别模型。视觉上下文信息通常能够辅助更准确的识别短文本社交媒体中的实体,以往的多模态命名实体识别工作只利用到了图像整体或者标签信息,而忽视了细粒度视觉对象和命名实体之前存在对应关系。同时,由于视觉表示和文本表示存在空间差异性,简单的拼接两者的表示会带来语义上的偏移。针对以上问题,本文提出了基于对抗训练和双线性注意力机制的多模态命名实体识别模型。该模型能够同时从视觉对象和文本中抽取实体相关的特征,同时利用对抗训练的方式将两种不同的模态表示映射到相同的语义向量空间。因此,包含在图像中的语义信息能够被迁移和利用,从而辅助准确的识别出文本中的命名实体。本文模型在社交媒体领域的Twitter多模态数据集上超过了过去所有State-of-the-art的模型,同时本文通过数据分布可视化、注意力权重可视化以及充实的案例分析证明了模型的有效性。
其他文献
装配式结构与再生混凝土技术满足高效节能、绿色环保的要求,在工程应用上越来越广泛。本文作者提出了一种钢筋冷挤压套筒连接装配式再生混凝土柱,以轴压比、纵筋率、再生细骨料取代率为参数,采用抗震性能试验、有限元模拟和参数化分析相结合的方法,对该9个钢筋冷挤压套筒连接装配式再生混凝土柱和1个现浇再生混凝土柱的抗震性能进行了深入研究。本文主要研究工作及成果如下:(1)作者提出了一种纵向钢筋采用冷挤压套筒连接的
重大工程环境责任对于重大工程的可持续发展至关重要,在重大工程实践中受到越来越多的关注。然而重大工程面临复杂内外部环境,不确定因素复杂,且涉及利益相关者众多,主体行为不确定性大,极易产生环境责任行为异化现象。重大工程环境责任行为异化机理极其复杂,异化行为治理难度大,且目前缺乏有效的治理对策。因此,研究重大工程环境责任行为异化问题,有效地遏制重大工程环境责任行为异化,具有重要的理论意义和实践价值。本论
为应对环境污染及能源危机两大世界难题,发展电动汽车已成为全球的共识。而随着电动汽车的迅猛发展,人们对电动汽车的安全性、续航等提出了更高的要求,设计开发出更高效、更可靠的热管理系统也成为了电动汽车领域研究的重点。基于相变冷却的电池热管理系统具有节能、防止电池热失控及优良的控温性能等优点,被认为是最具有前景的电池热管理技术之一。本文以18650磷酸铁锂电池组作为研究对象,采用仿真模拟与实验验证相结合的
带腋撑型钢混凝土大跨度框架结构是一种新的结构形式,它除了具有常规型钢混凝土框架结构所具有的优点外,还有以下几个突出的优势:1)通过设置腋撑改变了常规型钢混凝土框架结构的受力模式,有效地提高了结构的承载力和刚度;2)腋撑的设置减小了大跨度框架梁的跨度,从而在不影响建筑物使用功能的基础上,使框架梁的内力减少,所需截面尺寸和配筋也减少,同时更容易满足框架梁挠度和裂缝宽度的设计要求。因此,带腋撑型钢混凝土
以镁合金、铝合金为代表的新一代轻质材料具有密度小、可再生的特点,同时具有良好的比强度、比刚度、减震性和导热性,但通常活泼性极高、膨胀系数大导致其焊接性能并不友好。变极性钨极氩弧焊(Variable Polarity TIG,VPTIG)焊接工艺具有阴极雾化的作用,在轻质合金焊接工艺中扮演了重要角色。目前,市面上的VPTIG焊接电源存在控制精度低、响应速度慢、热输入量过大、变极性过零点速率慢,易断弧
传统村镇凝聚并传承了我国各地域的特色文化,彰显着独特的地域人文精神、建筑及传统风貌,2018年国务院出台的《乡村振兴战略规划(2018-2022年)》首次提出特色保护类村庄这一概念,其中涵盖具有地域特色明显、文物古迹或古建筑风格突出、非物质文化遗产丰富等特点的传统村镇;在城市化及新农村建设中,大量传统村镇对自身特色资源缺乏认识,在活化过程中地域特色被淡化、破坏。为扭转这一现象,在乡村振兴战略背景下
带腋撑型钢混凝土大跨度框架梁柱节点是一种新型的框架节点形式,应用于大跨度框架结构中。它具有以下优点:(1)腋撑的设置减小了大跨度梁的跨度,从而减小框架梁和柱的内力、梁柱截面尺寸和配筋,极大改善节点区的受力性能;(2)型钢混凝土组合结构的应用能有效减小构件截面尺寸和提高经济性,同时也能提升结构的延性和承载力。带腋撑的框架节点是该框架结构中受力复杂的关键位置,对其节点区的受力性能研究至关重要,所以开展
建筑必然离不开气候和地形地貌两个在地要素,脱离自然环境孤立地考虑建筑设计,或片面依赖技术手段解决人工环境问题,势必造成资源和能源极大浪费,同时失去地域差异的气候作为创作依据,改变了适应当地气候的建筑模式,将导致千篇一律的所谓“现代化”城市。中华传统民居运用朴素的技术手段营造生态宜居的建筑环境,凝聚了我国历代工匠的经验与才华。如何将传统民居中固有且宝贵的经验在现下得到继承并发扬光大,推动地域文化与绿
移动边缘计算将计算和存储资源带到移动网络的边缘,使移动设备能够运行对资源要求很高的应用程序,例如增强现实和在线游戏,同时满足严格的延迟要求。近年来,在移动边缘计算的热点上进行了许多研究工作,例如计算分流,低等待时间和能源效率,并获得了良好的实验结果。但是,很少有研究人员研究移动边缘服务器的部署。边缘服务器部署的好坏直接影响到资本支出,同时还会影响部署和配置的灵活性。移动设备的普及还促进了空间众包的
休闲时代的来临促进了城市旅游业的发展,以及城市游憩商业区(RBD)的出现。然而在目前国内的游憩商业区建设中,依然存在着过度商业化、商业同质化、功能与形态不适配等问题,因此,开展游憩商业区的空间及功能形态研究就具有重要的指导意义。在此背景之下,本文选取广州荔湾RBD为研究案例,基于空间句法理论,结合多源网络开放数据,分别从城市、街区、街坊三个尺度考察荔湾RBD的街道网络形态以及它与功能分布之间的互动