面向地理领域的实体关系抽取方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:asdfsadfsad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从地理领域文本等非结构化数据中抽取实体和关系,为构建地理知识图谱、智能问答等应用提供了重要基础。由于地理领域标注语料资源较少,难以使用深度学习等依赖大规模标注语料的方法,利用知识库中的领域知识对地理语料库进行表示增强,可以有效缓解语料不足的问题。传统神经网络模型在处理一维序列、二维网格数据时表现优异,但不能很好地处理知识库等图结构数据。现有的实体关系抽取模型不能很好地处理语料库中多元实体关系的情况,而且大多采用“就近原则”,降低了实体关系抽取的效果。针对上述问题,本文在自动标注地理语料库的基础上,利用图注意力网络学习知识库表示,通过远程监督对语料库进行表示增强,提出基于长短期记忆模型和概率图的实体关系抽取方法,有效地提升了地理领域实体关系抽取效果。
  论文的主要研究内容主要包括以下几部分:
  1)提出了基于动态投影和关系路径的知识表示学习方法学习知识库隐性语义信息。知识库等结构化数据中含有丰富的领域知识和语义信息,传统的知识表示学习方法在表示复杂关系类型时准确性不足且忽略了实体间多步路径中的隐式关系,本文利用基于动态投影和关系路径的知识表示学习方法对知识库进行知识表示学习,将实体和关系表示为低维稠密向量,得到知识库实体关系的隐式语义信息。该模型相较于传统的知识表示学习方法模型简单,计算效率高,可以有效表示复杂关系类型。
  2)应用图注意力网络学习知识库中显式关联性知识和结构信息,并对地理领域语料库中的实体进行表示增强。传统的神经网络在处理一维或二维数据时表现优异,但在处理图结构数据得到的图嵌入表示效果不佳,本文应用图注意力网络模型来学习知识库中实体关系间显式的关联性知识。借鉴远程监督的思想,如果语料库中的实体对在知识库中存在,则将知识库学习到的对应的实体表示的结果作为先验特征传入到模型中,与模型编码层学习到的文本表示进行拼接,得到新的文本表示。实验表明,知识库中的领域信息有效地提升了地理领域实体关系抽取效果,F1值大约提升0.85左右。
  3)设计了更加有效融入语义信息的字词混合向量特征,提出了基于双向长短期记忆模型和概率图的地理领域实体关系抽取模型。使用自然语言处理工具产生词向量时会产生并传播误差,而字向量包含的语义信息有限,因此本文采用更加有效融入语义信息的字词混合向量特征。双向长短期记忆模型结合注意力机制可以有效地获取文本上下文依赖信息从而得到文本的高级特征。针对语料中多个实体、多个关系的情况,本文利用类似seq2seq的概率图思想,先抽取头实体,遍历头文本中得到的实体序列并选取其中一个头实体,遍历关系,来抽取尾实体。实验表明,相较于目前的实体关系抽取方法,基于双向长短期记忆模型和概率图的地理领域实体关系抽取模型取得了较好的结果。
其他文献
多智能体系统因其高效率、高容错性、可扩展性等优势,己普遍应用于战斗机护航、多枚导弹协同突防以及智能交通信号控制等诸多方面.一致性是多智能体系统的基本问题,旨在设计控制协议使得每个智能体的状态趋于相同的值.在实际应用中,仅实现系统的一致性难以满足需求,往往还需考量成本函数以节省资源,特别是在系统规模庞大、能量资源有限的情形下,减少能量消耗尤为重要.因此,多智能体系统优化一致性成为近年来备受关注的研究
学位
本文主要研究正倒向随机系统的混合最优控制问题及在经济中的应用.分别针对倒向随机混合控制系统的最优控制问题、由倒向随机微分方程驱动的非零和混合微分博弈问题、正倒向随机系统的混合最优控制问题及其在经济中的应用进行了深入研究.  主要的学术贡献包括:首次给出由倒向随机混合控制系统驱动的最优控制问题存在唯一解的充分必要条件,给出了具有平均场形式的最优控制反馈表达且得到了最优状态满足一类平均场倒向随机微分方
在人-机器人协作过程中,通过灵活方便的方式对常用的串联型旋转关节构型的协作机器人进行实时位姿捕捉具有重要意义。虽然大部分机器人本体都配备有编码器系统,用于测量各关节的旋转角度,但通常要求编码器安装在关节中心处,在一些机械结构受限制的应用中难以实现。对于传感系统不开放的机器人,用户无法通过应用程序接口获取机器人关节角和位置信息,难以实现与其他系统的集成。此时,惯性-磁传感器设备可以提供一种灵活方便的
数字条纹投影三维(Three-dimensional,3D)测量技术因具有非接触式、高分辨率、高精度、高效率、高普适性、低成本、全场测量等优点,广泛应用于汽车工业、航空航天、新能源产业、船舶制造和交通运输等领域,是目前光学三维测量领域科学研究与产品研发的热点。市场上已有的测量产品价格昂贵,且大多采用的是双频外差解相位技术,在图像采集上耗时较长,限制了其在高速动态测量领域上的应用。本文围绕数字条纹投
目前制约道路交通系统发展的问题主要集中在交通事故、交通污染和交通拥堵方面。在汽车中开始大范围使用电子辅助设备,主要实现的辅助功能有电子稳定控制,车道偏离后的预警,以及紧急制动等。但针对降低人为因素导致的交通事故发生率的问题,目前车辆所使用的电子辅助系统并不能完全达到智能辅助驾驶的目的,也无法利用事故预警,以及风险评估等形式,来降低人为交通事故。因此,为了实现应用辅助驾驶系统或无人驾驶技术降低交通事
学位
在过程控制、流体控制、以及网络化控制等系统中,普遍存在着时滞现象和未知动态干扰,其控制问题一直是控制领域研究的热点话题。时滞和未知干扰往往是制约系统性能的主要因素,这些不确定因素通常会严重影响系统的响应速度和控制精度。因此,对于在系统中含有未知扰动、时滞等现象的研究在现阶段有十分重要的意义和价值。  自抗扰控制器(ADRC)作为一种新型控制器,具有较强的稳定性和鲁棒性,通过引入扩张状态观测器,实现
六足机器人作为一种并联机器人,因其运动方式灵活多变,稳定性强,所以其环境适应性较好,已经成为机器人中的主流产品。然而由于六足机器人腿部数量较多,使得六足机器人的控制难度增加。中枢模式发生器(CPG)的出现,为六足机器人的控制方法提供了新的思路。本文对六足机器人识别地形然后采取相应的步态规划进行研究,利用CPG控制六足机器人在地形环境中平稳行走。具体研究如下:  首先,通过研究国内外论文介绍目前六足
多智能体系统广泛存在于实际生产生活中,是控制领域的研究热点,而一致性问题作为智能体协调合作的基础,更是深受关注。受限于能源供应限制,以嵌入式微处理器为核心的多智能体系统在实际应用时约束较多,因此一致性控制协议不仅要满足性能要求,更要提高资源利用率。事件触发控制对于降低资源消耗效果显著,故而被认为是资源受限环境下的优良控制策略。再则,现有的关于事件触发控制下多智能体系统一致性问题研究的文献多是针对智
分数阶微积分是整数阶微积分的统一与延伸,是求函数的任意阶导数或积分。由于分数阶微积分算子的长记忆性和无限维等特点,使得分数阶模型可以简洁准确地描述复杂系统的动态行为。系统辨识作为分数阶系统建模的有效手段引起了很多学者的关注。目前,在分数阶系统辨识中,直接利用分数阶微分定义计算输入输出信号的分数阶微分存在计算量大,容易扩大噪声等缺点。为此,本文利用块脉冲函数的分数阶运算矩阵将函数的分数阶运算转换为代
受雾霾微粒影响,含雾图像清晰度及色彩饱和度降低,图像质量产生退化。图像去雾算法能够有效提高含雾图像能见度、改善图像视觉效果,因此具有十分重要的研究价值。结合含雾图像特征,本文着重研究了基于物理模型的图像去雾算法,主要工作如下:  (1)针对当前全局大气光估计方法存在易受极值区域影响,导致大气光估计产生偏差的问题,提出了一种基于最小方差投影的全局大气光估计方法。通过将图像沿行列方向投影,分析不同行列
学位