基于注意力机制与知识融合的法律判决预测模型研究

来源 :西南大学 | 被引量 : 0次 | 上传用户：sgrsrg

【摘要】

：

【作者】

：

李威

【机构】

：

西南大学

【出处】

：

西南大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着国家法治社会的推进以及法律法规的日益健全,公众采取相应的法律措施来维权,已成为维护自身权利与解决生活问题的一种重要手段,由此带来了海量的法律文本数据。然而,如何利用人工智能技术来获取法律文本数据中有价值的部分,并提高司法判决的效率和公平公正,是智慧司法的主要研究领域之一。法律判决预测（Legal Judgment Prediction,LJP）作为智慧司法的一部分,具有很高的研究价值。法律案件的事实描述是预测判决结果的重要依据,LJP可通过对事实描述的分析,来对判决的多个子任务进行预测,包括法律条文预测、罪名预测以及刑期预测等。法律判决预测可以为司法专业人士提供有参考价值的法律建议,适当缓解相关人员的工作压力,也可以为有法律需求的人提供高效且便捷的法律援助,促进国家法治社会的建设。因此,如何利用人工智能相关技术对法律判决过程进行有效建模,提高法律判决的性能是一个有重大研究意义的课题。大多数现有的研究将法律判决预测视为文本分类任务,采用机器学习或深度学习的方法对法律文本进行分类。由于法律知识的多样性和复杂性,导致基于传统机器学习的方法对预测效果并不佳,故具有很大的提升空间。由于深度学习模型拥有优秀的泛化能力和数据处理能力,因此在各个领域受到越来越多的关注,而在法律判决预测领域也是如此。此外,注意力机制被广泛应用在深度学习模型中,并且取得巨大的成功,主要思想是模拟人类的一种选择性机制,进而从大量的数据中挑选出与当前任务的密切相关的信息,这为判决过程中寻找与案件相关的关键信息提供新的思路。本文对基于注意力机制与知识融合的法律判决预测进行研究,主要的工作内容和贡献能总结为以下几点:1)本文提出基于注意力机制和知识感知的罪名预测模型（Knowledge-Aware Charge Prediction,KACP）。该模型主要研究的是罪名预测,现有的方法主要是利用案件的事实描述来预测罪名,由于忽略法律条文和罪名的丰富信息,导致不可靠的预测结果。因此,实际判决过程中,罪名和法律条文的相关知识对于判决结果是至关重要的,如何有效利用这些知识来丰富案件事实描述的语义信息,使得算法能够正确地预测罪名是该模型主要解决的问题。本文在现有研究工作的基础上将罪名和法律条文引入到模型中,并且与案件事实进行无缝融合,提高模型对法律知识的感知能力,使得模型有能够了解罪名和法律条文的法律背景知识,增强对于关键信息的获取。为了融合法律条文,在知识感知层中设计一个具有双层注意力机制的法条感知模块来增强法律条文之间的交互,以捕获句法和语义特征,并通过从事实描述中引入法律条文的特定特征来获得事实的增强表示。然后,再利用罪名感知模块从多个角度提取事实描述与罪名知识的融合特征。罪名感知模块首先构建罪名定义信息的相似度图,该相似度图用于聚合罪名的深度语义信息。其次将罪名特征与事实向量相互作用,以捕获案件的关键组成部分,以增强事实表示。最后,将从法律知识和事实表示中学习到的知识表示输入分类器,用以预测罪名。为了验证KACP的有效性,第三章进行充分的对比实验,将其与相关基线模型在多个真实刑事案件数据集上进行比较。KACP模型表现优于多个对比模型。同时,本文的第三章将利用大量的消融实验来验证KACP模型中各个模块对结果产生的影响。2)本文提出的基于任务依赖和标签约束的序列多任务法律判决预测模型（task Dependencies and label Constraints for Legal Judgment Prediction,DCLJP）。该模型主要是用于解决法律判决预测的多个子任务包括法律条文预测,罪名预测,刑期预测。在实际判决过程中这三个子任务彼此密切相关,相互影响。然而,现有的方法常常将法律判决预测的多个任务,当成独立的子任务进行处理,因此无法捕捉子任务之间的依赖和约束关系,从而导致判决预测效果不佳。为了更好的利用不同子任务之间的逻辑关系,让模型准确地模拟真实情况下法官判决的逻辑。本文将子任务之间存在依赖关系形式化为一个有向无环图,并且设计一种正向传播机制在该有向无环图上,来捕获简单的依赖关系。由于多任务标签拥有一致性约束,因此,本研究利用一个校准函数来达到约束目标,提高预测性能。此外,考虑到刑期预测的复杂性和可变性,进一步提出情节严重性的子任务,在此任务结果的基础上,采用一阶谓词逻辑的推理方法,使模型更加关注与情节严重性相对应的刑期。DCLJP模型在两个真实的法律数据集上的实验结果表明,与多种对比方法相比,DCLJP性能有显著提高。综上所述,本文针对基于注意力机制与知识融合的法律判决预测进行研究,首先研究结合法律知识增强的罪名预测的任务,在此基础上提出一个模拟司法判决过程的多任务法律判决预测模型,主要包含法律条文预测,罪名预测,刑期预测三个子任务。同时,本文进行多组对比实验,实验结果验证模型的有效性和可行性。

其他文献

基于深度学习的高中语文新闻大单元教学设计研究

在21世纪中国的基础教育改革浪潮中,2022年修订的新课标强调学校在课程和教学上要作出重大改变,要注重教学改革,关注教学模式的转变。因此亟待教育工作者关注教育热点,紧跟知识经济时代步伐,探索落实语文核心素养的新实践,单元教学以大单元新姿态重登语文教学舞台。深度学习除了强调品格、公民意识、协作和沟通,更加重视学生批判性和创造性思维的发展。内涵从过去的4C转向6C的完善,使得深度学习成为国际教育发展的

学位

学业成绩与主观幸福感：基本心理需要的中介和性别的调节作用

学位

新国标过渡期电动自行车一般程序交通事故影响因素研究

随着《电动自行车安全技术规范》（GB17761—2018）正式实施,市面上流通的一部分超过该技术规范标准的电动自行车面临全部清退,J市政府为此设立三年过渡期,并要求超过标准的电动自行车在过渡期内必须办理临时号牌。但是此举并没有让道路交通秩序更规范、更安全,电动自行车交通事故伤亡人数不降反升。在此背景下,选取电动自行车交通事故为对象,对影响其发生的因素进行研究。本文研究人员前期通过查阅大量关于电动自

学位

基于区块链的算力网络资源共享机制研究

云计算、边缘计算的发展和智能终端的普及驱动着计算资源的分布更加分散、更加泛在化。在未来,规模不同,分布泛在的海量算力资源将从各处接入网络,形成云、边、端三级算力架构,并形成计算和网络深度融合的发展趋势。在此背景下,我国率先提出了算力网络的概念。与此同时,区块链凭借其独有的信任建立机制和去中心化、可追溯、不可篡改、安全可靠等特性,正成为未来构建新型信任体系不可或缺的技术之一,采用区块链技术构建算力网

学位

改造与重塑：天津市工人扫盲运动研究（1949-1956）

新中国建立初期,党的工作重心由农村转移至城市。然而,彼时城市民生凋敝,百业待兴。因此,推动城市经济建设,稳定城市正常运转成为党的一项中心任务。工厂企业是城市的经济命脉,城市经济状况的起伏取决于工厂企业的兴衰,工厂企业经营的成败取决于工人阶级生产力量的强弱。但是,当时中国工人阶级普遍学识浅显、不通文墨,封建保守思想残余较多,缺乏正确的阶级意识与劳动价值观。同时,许多工人在生产中仍运用传统作业手法,未

学位

人教版七年级下册“实数”（第一课时）教学实录与评析

文章以初中数学七年级下册“实数”（第一课时）的教学为例，将数的范围从有理数扩展到实数，帮助学生理清无理数与有理数的区别，明白实数的真实含义，同时通过引入数学发展史、设置问题链、进行变式练习、总结知识方法，打造“四度”课堂，促进师生共同发展。

期刊

介入手术治疗脑供血动脉狭窄的效果探讨

目的探讨介入手术治疗脑供血动脉狭窄的效果。方法选取2019年5月至2022年5月我院收治的80例脑供血动脉狭窄患者，随机分为两组各40例。对照组采用常规药物治疗，观察组采用介入手术治疗，比较两组患者的动脉血流速度、神经功能及并发症发生率。结果治疗后3个月，观察组椎动脉、基底动脉、颈内动脉血流速度及NIHSS评分均低于对照组（P ＜0.05）。观察组并发症发生率为10.00%，与对照组的5.0

期刊

在结构化知识体系整体建构和综合应用中发展数学核心素养——有理数与实数

《义务教育数学课程标准（2022年版）》提出了数学核心素养导向，落实了“四基”“四能”的课程目标，界定了数学核心素养的内涵及其具体表现，提出了核心素养导向的教学建议，但是如何融合具体单元内容开展核心素养导向的教学，需要更多的理论建构和实践研究.文章回顾了数的发展历程及其逻辑脉络，分析了初中阶段数的课程内容所蕴含的发展数学核心素养的育人价值，在此基础上，提出在结构化知识体系整体建构和综合应用中发展学

期刊

经历概念生成过程发展数学核心素养——以“实数”教学为例

精心设计组织探究活动，让学生经历概念生成的过程.通过类比迁移、抽象概括，让学生感受无理数的存在性，理解无理数概念产生的合理性，感悟数系扩充的必然性.在体会知识生长、归纳研究方法、积累经验的过程中，发展数学核心素养.

期刊

以太坊交易网络钓鱼节点检测研究

学位

基于注意力机制与知识融合的法律判决预测模型研究

与本文相关的学术论文