面向司法案件的实体关系与事件关系抽取方法

来源 :上海大学 | 被引量 : 0次 | 上传用户:haixinkp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
司法智能是目前人工智能应用领域的研究热点和难点之一。案件分析和理解是案件审理的基础,其核心是案件实体关系和事件关系抽取技术。在实践中,由于司法案件情节和关系的复杂性,司法案件实体关系和事件关系抽取还存在诸多困难,例如:实体分布离散导致的远距离实体关系抽取困难,因果指示词缺乏导致的隐式事件因果关系抽取困难,干扰信息导致的关系识别精度降低等问题,需要针对司法领域的特点深入研究案件实体关系和事件关系抽取方法。本文重点解决司法案件关系抽取的三个关键问题:1)如何构建案件实体远距离关联特征,对司法案件远距离实体关系进行抽取,同时减少错误和重复关系三元组的产生,提高案件实体关系识别的准确率。2)如何充分挖掘案件文本语义特征,对事件隐式因果关系进行抽取,并对顺序时序和同步时序关系进行区分,提高案件中事件关系识别的准确率。3)如何在保证不缺失案件背景语义的条件下,削弱干扰语句的语义信息,提升案件实体关系和事件关系的准确率。针对以上三个问题,本文主要研究以下三个内容:1)基于远距离依赖特征和指称聚合的司法案件实体关系抽取方法。为了解决司法案件远距离实体关系抽取困难、实体指称组合爆炸的问题,本文通过对司法案件文本进行依存句法分析,并添加自反依赖,利用图神经网络对改进后的依存关系编码进行多轮传播以获取实体远距离依赖特征。同时,分别构建头实体表示空间和尾实体表示空间对指称进行实体聚合表示,减少重复和无效实体关系三元组的产生,从而提升实体关系抽取的准确率和召回率。2)融合上下文和多尺度局部特征的案件事件时序因果关系联合抽取方法。为了解决事件隐式因果关系抽取困难,以及顺序时序和同步时序关系难以区分的问题,本文使用双向GRU和多尺度卷积神经网络分别获取司法案件文本上下文语义特征和不同粒度的局部语义特征,并将上述特征进行融合,得到更为丰富的案件文本语义表示。针对因果关系和时序关系抽取分别构建各自的关系编码器和解码器,利用三种不同的共享参数策略实现因果特征和时序特征之间的交互,通过时序关系和因果关系的关联为彼此正确识别提供额外语义信息。3)基于干扰信息语义弱化的案件实体关系和事件关系抽取方法。为了削弱司法案件中实体关系与事件关系干扰语句的语义信息,降低干扰信息对关系抽取的影响,本文分析了司法案件文本中实体、事件分布与干扰信息的关联,通过计算实体、事件的概率分布,初步降低干扰语句的语义权重。同时利用句子级注意力机制进一步获取干扰语句与关系特征的低关联权重值,降低模型对干扰信息语义学习的能力,而提升模型对关系特征的获取能力,从而提升实体关系和事件关系识别的准确率。本文构建了司法案件数据集,对提出的三个方法进行了实验评价,结果显示本文方法在各评价指标上均优于对比方法。同时,本文开发了一个司法案件实体关系和事件关系抽取原型系统,进一步检验了所提出方法的有效性。
其他文献
数智时代背景下,以纳米技术、人工智能、基因工程等为代表的新兴技术的发展,在带来高速流通信息、突破性研究进展及便利生活方式的同时,也往往暗藏着当下难以判别但未来可能影响深远的重大隐患和危机。目前,学术界对责任式创新的理念内涵、理论框架等进行了一定探讨,强调更大范围内的异质性利益相关者协同治理,但是在多主体协同过程中容易出现权责不清、协同不力等“多手问题”,而且一旦责任比例归咎失当,还会引发责任失衡风
学位
结合参与设计和咨询审查的多条高速公路改扩建项目,针对桥梁改扩建关键技术,进行总结研究,以期对工程技术人员有一定的指导意义。
期刊
数值模拟是对流体力学现象分析的一种新兴技术,它利用计算机求解流体的流动控制方程以得到流体的流动状态,从而得以分析流动现象。数值模拟方法在算法参数设置合理的情况下能达到很高的计算精度,但是它的计算成本非常高昂,并且无法满足实时性的需求。降阶模型是用于代替复杂的动力学控制方程模型的一种近似模型,它在可接受的时间范围内和有限的存储容量内执行仿真,并得到足够可靠的结果。降阶模型具有极快的模拟速度以及较为精
学位
大数据是当今数字化信息社会的最关键特征之一,传统的运行在单机上的机器学习算法面对爆炸式增长的数据无法满足存储和计算的需求。高性能计算系统的发展为算法并行化提供了强有力的平台。充分利用高性能计算系统的资源,设计并实现高效的分布式算法是需要研究解决的问题。交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)是一种具有分解性和收敛性的优化算法
学位
Ni-Mn-Ga合金性能调控和组织控制一直是智能材料领域的研究热点。富镍Ni-Mn-Ga合金中γ相的引入极大地提升了材料的韧性,使其展现出广阔的应用前景。然而以往对富镍Ni-Mn-Ga合金中γ相和马氏体相的形貌、取向和成分分布等在Ni-Mn-Ga合金应变过程中的影响机制研究较少。此外,外场下Ni-Mn-Ga合金相变过程中的晶体学演化也是探究其性能变化的关键。因此本论文拟通过改变合金成分或者利用调控
学位
农田水利建设对促进农业生产和提升农村经济发展水平都发挥着重要作用。建设好农村农田的水利工程,从源头上保障农业生产的顺利开展,进而促进农村经济生活水平不断提高,逐渐完成新农村建设的伟大事业。本文将从当代农村水利建设的现状,以及当代农村农田水利建设的对策等方面进行探究分析,提出相关的建议。
期刊
糖尿病足(Diabetic Foot,DF)是糖尿病最常见也是最严重的并发症之一,糖尿病足预后很差,而我国糖尿病足的知晓率和就诊率较低。在糖尿病足治疗过程中,糖尿病足溃疡(Diabetic Foot Ulcer,DFU)伤口愈合周期较长,现临床上医生很难在短期治疗过程中以现有分级标准量化糖尿病足溃疡愈合进展,从而评估治疗方案有效性。因此,早期发现、诊断、治疗糖尿病足显得尤为重要。近年来,计算机辅助
学位
高校园区建设作为新时期国土空间规划体系中的重要一环,且人口结构以高素质人群为主体,其发展目标有着更高的要求。高校园区公共空间主要使用者的行为活动是衡量公共空间设计品质的标准。本文充分了解和分析使用者的需求,结合使用后评价理论以郑州龙子湖高校园区公共空间为例对其进行科学评价,结果表明郑州龙子湖高校园区公共空间整体评价为E2(较好),并据此提出优化建议。旨在为龙子湖高校园区公共空间乃至之后的城市高校园
期刊
近年来,农村地区农田水利工程建设问题显得越加突出,在很大程度上影响着农业生产和农民的日常生活。农田水利建设一旦出现任何问题,都会对农民生活质量和周边生态环境造成严重的不良影响,因此如何有效地促进我国农田水利工程的建设与发展十分重要。本文对此做了相关研究,首先对农田水利工程做了简要介绍,阐述了其相应的特点,然后分析了当前我国农田水利工程建设发展现状,最后结合实际探讨了促进农田水利发展的有效对策。
期刊
取消药品加成、鼓励各级各类医疗机构平等参与和适度竞争是我国公立医院改革的重要内容,它有助于解决公立医院“以药养医”,引导医疗联合体有序发展,从而控制医疗费用上涨、提高医疗质量和服务效率。然而,对医院而言,补偿渠道的减少以及市场竞争的加剧,使得很多医院收不抵支,负债率逐年攀升,医疗机构逐利性不断加强。本文主要研究在补偿渠道减少和市场竞争加剧的背景下,通过引入政府公益性监管和财政补偿机制,以优化医院运
学位