论文部分内容阅读
随着国家法治社会的推进以及法律法规的日益健全,公众采取相应的法律措施来维权,已成为维护自身权利与解决生活问题的一种重要手段,由此带来了海量的法律文本数据。然而,如何利用人工智能技术来获取法律文本数据中有价值的部分,并提高司法判决的效率和公平公正,是智慧司法的主要研究领域之一。法律判决预测(Legal Judgment Prediction,LJP)作为智慧司法的一部分,具有很高的研究价值。法律案件的事实描述是预测判决结果的重要依据,LJP可通过对事实描述的分析,来对判决的多个子任务进行预测,包括法律条文预测、罪名预测以及刑期预测等。法律判决预测可以为司法专业人士提供有参考价值的法律建议,适当缓解相关人员的工作压力,也可以为有法律需求的人提供高效且便捷的法律援助,促进国家法治社会的建设。因此,如何利用人工智能相关技术对法律判决过程进行有效建模,提高法律判决的性能是一个有重大研究意义的课题。大多数现有的研究将法律判决预测视为文本分类任务,采用机器学习或深度学习的方法对法律文本进行分类。由于法律知识的多样性和复杂性,导致基于传统机器学习的方法对预测效果并不佳,故具有很大的提升空间。由于深度学习模型拥有优秀的泛化能力和数据处理能力,因此在各个领域受到越来越多的关注,而在法律判决预测领域也是如此。此外,注意力机制被广泛应用在深度学习模型中,并且取得巨大的成功,主要思想是模拟人类的一种选择性机制,进而从大量的数据中挑选出与当前任务的密切相关的信息,这为判决过程中寻找与案件相关的关键信息提供新的思路。本文对基于注意力机制与知识融合的法律判决预测进行研究,主要的工作内容和贡献能总结为以下几点:1)本文提出基于注意力机制和知识感知的罪名预测模型(Knowledge-Aware Charge Prediction,KACP)。该模型主要研究的是罪名预测,现有的方法主要是利用案件的事实描述来预测罪名,由于忽略法律条文和罪名的丰富信息,导致不可靠的预测结果。因此,实际判决过程中,罪名和法律条文的相关知识对于判决结果是至关重要的,如何有效利用这些知识来丰富案件事实描述的语义信息,使得算法能够正确地预测罪名是该模型主要解决的问题。本文在现有研究工作的基础上将罪名和法律条文引入到模型中,并且与案件事实进行无缝融合,提高模型对法律知识的感知能力,使得模型有能够了解罪名和法律条文的法律背景知识,增强对于关键信息的获取。为了融合法律条文,在知识感知层中设计一个具有双层注意力机制的法条感知模块来增强法律条文之间的交互,以捕获句法和语义特征,并通过从事实描述中引入法律条文的特定特征来获得事实的增强表示。然后,再利用罪名感知模块从多个角度提取事实描述与罪名知识的融合特征。罪名感知模块首先构建罪名定义信息的相似度图,该相似度图用于聚合罪名的深度语义信息。其次将罪名特征与事实向量相互作用,以捕获案件的关键组成部分,以增强事实表示。最后,将从法律知识和事实表示中学习到的知识表示输入分类器,用以预测罪名。为了验证KACP的有效性,第三章进行充分的对比实验,将其与相关基线模型在多个真实刑事案件数据集上进行比较。KACP模型表现优于多个对比模型。同时,本文的第三章将利用大量的消融实验来验证KACP模型中各个模块对结果产生的影响。2)本文提出的基于任务依赖和标签约束的序列多任务法律判决预测模型(task Dependencies and label Constraints for Legal Judgment Prediction,DCLJP)。该模型主要是用于解决法律判决预测的多个子任务包括法律条文预测,罪名预测,刑期预测。在实际判决过程中这三个子任务彼此密切相关,相互影响。然而,现有的方法常常将法律判决预测的多个任务,当成独立的子任务进行处理,因此无法捕捉子任务之间的依赖和约束关系,从而导致判决预测效果不佳。为了更好的利用不同子任务之间的逻辑关系,让模型准确地模拟真实情况下法官判决的逻辑。本文将子任务之间存在依赖关系形式化为一个有向无环图,并且设计一种正向传播机制在该有向无环图上,来捕获简单的依赖关系。由于多任务标签拥有一致性约束,因此,本研究利用一个校准函数来达到约束目标,提高预测性能。此外,考虑到刑期预测的复杂性和可变性,进一步提出情节严重性的子任务,在此任务结果的基础上,采用一阶谓词逻辑的推理方法,使模型更加关注与情节严重性相对应的刑期。DCLJP模型在两个真实的法律数据集上的实验结果表明,与多种对比方法相比,DCLJP性能有显著提高。综上所述,本文针对基于注意力机制与知识融合的法律判决预测进行研究,首先研究结合法律知识增强的罪名预测的任务,在此基础上提出一个模拟司法判决过程的多任务法律判决预测模型,主要包含法律条文预测,罪名预测,刑期预测三个子任务。同时,本文进行多组对比实验,实验结果验证模型的有效性和可行性。