融合冗余实体特征的中文实体关系抽取研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:newrevon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,实体关系抽取一直是文本信息处理领域的重要研究任务之一,对自然语言理解研究和构建大规模知识图谱至关重要。传统实体关系抽取方法存在特征提取误差传播问题,极大影响实体关系抽取效果。随着深度学习在实体关系抽取上的应用,该问题得到有效缓解。但大多数关于关系抽取研究的工作都将范围限制在同时识别文中指定的两个实体之间的关系。这种方法导致模型针对多个实体的文本时没有充分利用文本中其他实体信息,出现实体冗余现象。而同时识别文本中多个实体关系时,易忽略多个关系之间的依赖信息,出现实体关系冗余现象。针对以上问题,本文的主要研究工作如下:1.从融合冗余实体特征出发,提出了一种基于多粒度输入和实体注意力机制的关系抽取模型。该模型首先通过格框架思想,将文本中潜在的词级信息和实体词组信息动态地合并到字序列输入中,增强实体信息表示,避免分词错误传播。进而,结合实体注意力机制和多头注意力机制,分别抽取出关注全局信息的目标实体和冗余实体,将二者融合之后进行关系预测。最后,与其它使用格框架的神经网络模型进行对比实验,同时使用消融实验证明该模型的的有效性。实验表明该模型具有较好的泛化能力和鲁棒性。2.从融合冗余实体关系特征出发,提出了一种基于图注意神经网络和关系矩阵注意力机制的关系抽取模型。针对同一文本中多个实体间存在的冗余关系,该模型首先使用图注意神经网络捕获实体与关系之间的约束信息,然后使用关系矩阵注意力机制对文本中所有关系进行关注以获得多个关系之间的隐含信息,最后将二者特征融合之后进行关系预测。对比实验表明,该方法具有更高的关系抽取的性能,特别是针对多个关系的实例数据。3.设计了一个中文实体关系抽取的原型系统。主要功能是快速实现实体关系抽取任务并展示实体关系的拓扑结构。该系统采用模块化的设计方案,对数据集预处理、模型训练等流程结果进行单独的可视化,验证及展示了本文提出的实体关系抽取方法。
其他文献
利用学科交叉将一些非传统的方法引入信息安全领域,研究新的信息安全保护技术正日益受到关注。混沌是非线性动力学中的类随机现象,它具有初值的高度敏感性、强随机性和混沌轨道周期的长期不可预测性的特性,这些特性和密码学中混淆和扩散密切相关。将混沌理论用于密码学中形成了混沌密码学,它具有随机性好、密钥空间大和安全性高等特点,已经成为非线性科学与信息科学交叉研究的热点领域。混沌系统通常包括简单混沌系统和复杂混沌
学位
支持巨容量、大连接、高可靠、超低时延和绿色智能是新一代移动通信系统演进的方向。移动边缘计算将任务的存储和处理推向移动通信网络的边缘,实现更靠近终端的信息传输、存储和计算融合,极大增强了移动通信系统对计算密集型和时延敏感型应用的支持,已成为目前移动通信领域的研究热点。移动边缘计算需要解决的一个核心问题是针对密集异构的移动边缘网络结构和用户需求的多样性,如何实现高效的任务卸载、资源分配和算网协同。针对
学位
数学历来是学生较为头疼的学科,许多学生在上数学课时,都会有巨大的心理压力.随着双减政策的提出,教师逐渐意识到减轻学生负担的重要性,积极地秉承“减负增效”的教育思想优化传统教法,在打造趣味性、生活化的课堂中,充分释放学生的学习压力,让学生以更加轻松、自在的心态遨游在数学的海洋.
期刊
"双减"政策的实施,迫使全国义务教育学校不得不改变现有的教学模式,以减轻学生在作业和校外培训方面的负担。数学是初中教学中的重点,也是学生们最为关注的学习难点。初中数学教师应该积极响应"双减"政策,不断思考并在教学活动中进行改进,以便学生能够轻松高效地学习,并全面发展他们的数学能力。
会议
室内位置信息在无线网络中扮演了极其重要的角色,并且定位作为最重要的功能之一,也已经被纳入到下一代通信技术白皮书中。随着基于多输入多输出(Multiple Input Multiple Output,MIMO)的多天线技术和正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)调制技术在Wi Fi、4G及5G通信网络中的使用,基于到达角(Ang
学位
网页作为网络盛行下的新媒介平台,具有较强的信息传递功能。然而随着大数据信息时代的来临,网页所承载的信息越发冗杂,只是简单的信息堆砌已经无法满足用户的使用需求。网页设计者需要通过视觉元素的设计划分来实现页面的优化,提升用户的使用体验。而接受美学虽为文学研究领域的理论,但其中强调的作者—作品—读者三者间的关系,与网页设计中设计者—设计作品—用户三者的关系具有共通之处。因此,此次研究通过对接受美学理论相
学位
随着信息时代的飞速发展,传感器接收到的观测信号越来越复杂。从观测信号中提取出有用信息是当前信号处理领域研究的重点和难点,尤其是解决盲信号的分离问题。其中,盲源分离(Blind Source Separation,BSS)结合了信号处理、神经网络和数理统计等方面的特点,被广泛地应用于通信技术、生物医学、语音分离和图像处理等诸多领域。在不同混合模型下研究传输信道对盲信号分离方法的影响可以解决相应的实际
学位
知识分享经济颠覆了人们获取知识的方式,随着在线支付体系的逐步建立和完善、版权保护体系的完善和用户为知识付费的习惯养成,在线付费问答显示出极大的发展潜力。如何促进付费问答模式的创新以及维持付费问答的可持续发展,已成为付费问答平台和学者共同的关注点。付费旁听允许旁听者以相对较低的固定费用获取答案,同时答主和提问者能分享来自旁听者支付的收益。旁听机制的存在有利于促进各类用户的参与,提升平台竞争力并维持平
学位
云计算、触觉互联网以及车联网的兴起和绿色通信网络技术的发展,推动骨干网向大容量、高速率和低时延不断演进。然而,传统接入网发展相对缓慢,成为通信网络“最后一公里”的瓶颈问题。鉴于光纤接入和无线接入的潜在优势和互补特点,学术界和工业界提出了光纤无线(Fiber Wireless,Fi Wi)宽带接入网,为智能移动设备(Smart Mobile Device,SMD)提供高质量的增强移动宽带体验。随着用
学位
近年来,由于集中式的数据处理方式很难胜任一些具有大数据量的工业任务,因此分布式的数据处理方式得到了快速的发展。作为一项新型的分布式数据处理技术,多智能体网络及其一致性受到了广泛的关注和研究。本文主要对基于多场景的多智能体网络的一致性及应用进行了研究,主要内容如下:(1)研究了基于混合控制机制的多智能体网络的一致性问题。为了使多智能体网络能够适用于多种场景,首先,提出了两种结合连续控制机制和脉冲控制
学位