论文部分内容阅读
随着我国司法量刑领域“案多人少”等复杂问题的不断加剧,司法机关工作者的工作压力和负担不断地增大,为平衡我国日益增长的司法量刑案件规模与不平衡不充分的司法机关人力和司法判决公正之间关系,文本着重研究司法决策中的辅助量刑问题,结合人工智能和领域知识对案件进行剖析,充分发挥计算机科学与其他学科相结合的优势,努力打造透明、公正的司法量刑,对于维护司法公正,构建法治社会具有重要意义。本文从司法量刑领域的数据处理入手,分别对裁判文书数据集和中国法研杯CAIL2018数据集分别进行处理,主要包括数据集获取、数据清洗、有效信息提取以及文本段落分词。之后为方便文本数据在计算机系统中的表达,本文采用多个词向量模型对单词进行分布式向量编码,并针对本文任务选取最为合适的词向量模型及其参数。鉴于司法判决中案件的刑期判决与法律法规之间密不可分的关系,本文提出基于多通道注意力机制的刑事案件辅助量刑技术。其采用被告人基本信息、案件事实描述以及法律法规三个通道,通过多头自注意力机制对其文本进行向量化表示,之后通过文档聚合器将多方信息进行融合表示,以被告人基本信息和案件事实描述查询该案件所涉及法律法规,从而实现依据法律法规的精准量刑。通过实验结果可见,该模型在刑期预测方面具有一定的优越性。通过对模型的分析,我们发现该模型在训练效率,可解释性等方面仍存在不足,基于这些问题我们在基于多通道注意力机制的刑事案件辅助量刑技术的基础上提出基于规则强化的刑事案件辅助量刑技术。该模型利用量刑规则对案件刑期预测结果进行缩放,其首先使用层次注意力机制对案件事实描述和被告人基本信息进行向量表示,采用结合前向反馈的多任务联合训练的方法将量刑预测结果反馈至刑期预测任务中,从而实现规则强化的刑期预测。实验结果表明,该模型在效率上远高于其余对比模型,在刑期预测准确率上仍具有较大的优势,同时该模型的输出除刑期外,还包含有量刑所依据的量刑规则和计算方法,对刑期预测结果具备良好的可解释性,用户体验感好,为实际应用奠定了理论基础。