面向法律庭审记录文书的发言人指代消解研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:shixibaogao007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
指代消解是自然语言处理的基本任务之一,对篇章的语义理解具有重要作用。现有研究主要集中于普通领域的文本,如:新闻通讯、广播对话、百科和博客等,对法律领域的指代消解研究关注较少。不同于普通文本,法律文本表述严谨、高度专业、富含知识。在庭审记录文书中,发言人具有一种至多种代称表述,实现发言人实体间的指代消解,对于法律文本分析具有重要意义。基于此,本文提出了一种融合标签表示的端到端指代消解方法,联合地进行实体识别与指代消解。本文主要从三个方面展开讨论:1)针对与发言人相关的代称实体、名称实体与诉讼地位实体,将实体间的关系对应形式化为篇章级的指代消解问题。实验性地探讨了两种指代思路,分别是代称实体到名称实体的指代与代称实体到诉讼地位实体的指代。根据实体相关性的实验结论,设计标签策略,将诉讼地位的预定义类别信息融合到名称实体的标签中,针对名称实体与代称实体实现端到端的指代消解。2)基于双重打分机制的串行指代消解模型。本文将该任务分解为实体识别与指代消解两个步骤进行,首先,采用序列标注模型识别实体;然后,构建实体间引用信息,通过图卷积神经网络融合到实体表示中;最后,结合前馈神经网络与双仿射注意力机制对候选对的不同表示进行打分,考虑候选对中回指词与先行词的依赖关系。3)融合标签信息的端到端指代消解模型。基于串行模型的实验性结论,联合地进行实体识别与指代消解,首先,使用跨度短语动态剪枝模块,保留置信度高的跨度短语作为候选实体;其次,编码实体标签表示,计算当前回指词与先行词标签表示的相似性,将相似度得分计入候选打分模块;最后,使用双重打分机制,为候选对计算最终得分。标签信息的融入,可有效缓解实体比例不均衡的问题,充分利用代称实体与诉讼地位实体的相关关系,提升模型对不同类别实体的共指预测能力。在庭审记录文书数据集上的实验结果表明,本文提出的端到端指代消解方法能合理地建模发言人实体的指代消解问题,相比基线模型,实验结果提升2至7个百分点,达到75.35%的F1值。缓解了流水线模型中的错误传播问题,实现了子任务间的信息共享,证实了本文建模方法的有效性。
其他文献
掺水集油是常见的一种油气集输工艺。掺水量对于集输系统的安全运行和系统能耗有着重大影响。掺水量过大,系统能耗升高;掺水量过小,集输系统运行安全性降低。实际生产中,掺水量主要是靠人凭经验操控掺水阀门实现,难以有效计量。对于大多数已建计量间而言,由于设计初期未考虑到掺水流量计量问题,剩余空间狭小,难以安装电磁流量计、涡街流量计等传统的流量计。另外,由于掺水量和热洗水量相差巨大,传统的流量计难以满足流量范
汽车减振器活塞杆(以下简称活塞杆)作为汽车悬架减振器的核心部件之一,在悬架系统中起导向和支撑的作用。活塞杆的质量可直接影响汽车行驶时的安全性和稳定性。活塞杆不仅受轴向、侧向往复力和摩擦力等作用,还要在其车身连接处的用户端设计扳手机构。为了提高活塞杆的力学特性,活塞杆表面进行微观微裂纹镀硬铬处理。由于活塞杆电镀不良、搬运不当等出现的电镀毛孔与电镀附着物、擦痕等导致圆柱表面宏观瑕疵;由于电镀工艺不当导
膜分离技术在水体的处理,特别是废水处理中有着十分广泛的使用,吸附膜作为分离膜材料的一种,是分离膜与吸附相结合的一种材料。吸附膜是使用具有一定孔径的膜材料作为基体或介质,将具有目标功能的颗粒或基团嵌入/连接到膜上,使其具有膜分离和吸附两种能力。膜材料性能优异,应用广泛,近年来对膜材料的改性一直以来是研究热点。本文选用的超支化聚酰胺-胺(HPAMAM)具有特殊的超支化结构和大量的端胺基团,且相较于具有
在我国悠久的养老历史发展中,家庭养老具有极其重要的地位,家庭养老能够延续几千年,孝文化在其中发挥了不可替代的作用。但由于经济的发展以及人们思想观念改变带来的冲击,孝
随着社会的进步,智能汽车逐渐走入人们的生活,我国政府高度重视智能汽车的发展,而驾驶员辅助系统被普遍认为是使智能汽车实现自动驾驶的过程性技术,因此,研究ADAS驾驶模拟器整体上是符合未来汽车开发的趋势,同时,转向装置作为ADAS驾驶模拟器中的重要一环,其路感的逼真程度直接影响驾驶员对车辆操作的准确性,对驾驶模拟器的品质起到了极为重要的作用。本文对ADAS驾驶模拟器的开发包括了选择系统软件、选择系统硬
由于超空泡减阻技术的应用,水下航行体的速度得到了极大的提升。但是,水下高速航行体所处环境的复杂性,包裹航行体的空泡不断变化等都为航行体的机动控制带来了极大的困难。针对水下高速航行体运动时所面临的的外部噪声干扰、模型不确定性以及部分状态参数不可测等问题,设计有效的观测器和鲁棒控制器具有重要的理论价值和实际意义。因此,本文在对水下高速航行体进行纵平面建模的基础上,完成观测器和控制器的设计方法研究及仿真
语言与社会阶层是社会语言学中经久不衰的话题之一,它伴随了社会语言学的诞生和发展。语言的阶层差异在有过被殖民史的地区常表现为双语或多语现象。在有多语现象的地区,语码选择的阶层差异反映了一定的权力关系和意识形态。为研究该话题,本文选取电影语篇《起跑线》作为语料。该电影借由印度中产阶层家庭的择校问题探究语言现象背后的社会因素。为更好地研究电影这种多模态语篇并能够探究其社会意义,本文采用了多模态批评话语分
在现阶段“大众创业,万众创新”的新时代背景下,多种多样的创新活动在全社会范围内都备受推崇。而在传统创新视角中,人们往往认为走上成功的创新之路只有研发这一条“单行道”。这种只认为研发才能进行创新的单一线性观点在很大程度上忽视了在研发实力上较为薄弱的中小企业所做出的并非基于正式研发的创新活动。在现实情况中,有很多企业尤其是中小企业往往都没有足够的资源或能力支撑以研发为主的创新活动,但是这并不表明这些企
近年来,随着量子计算机的不断发展,量子计算以其超强的并行计算能力和指数级的存储容量等特征,被誉为未来计算科学发展的重要方向之一。量子计算充分利用了量子的某些固有性质,如量子的相干性、量子叠加性、量子纠缠态和量子测量等进行运算和数据处理。智能优化算法是目前人工智能优化研究领域的一个重要分支,主要是人们受自然界或者生物界规律的启发,根据其原理,模仿其规律而设计的一类求解问题的算法。量子计算原理与智能优
能源和环境问题已引起全球关注,生产可再生能源、全面保护生态环境已成为科学研究的重点。半导体光催化技术(如光分解水生成氢和氧,利用光催化进行选择性有机物合成,利用光催化去除污染物等)被认为是解决能源短缺现象与环境污染问题最具前景的技术之一。为了使该项技术更好应用与人类可持续发展,一些研究者将目光转向新型光催化剂研发。单斜白钨矿型钒酸铋(BiVO_4)作为能响应可见光的新型光催化剂,具有成本低、无毒、