【摘 要】
:
随着法律从业标准愈加严格,从业人员规模的扩大远慢于刑事案件数量的增加,司法机关面临“案多人少”的困难;且法官的自由裁量权受其学识水平、工作经验等主观因素的影响,可能造成“同案不同判”的情况,影响司法公正性。为解决以上问题,本文以刑事判决文书为输入,使用自然语言处理技术,将案情自动化分析分解为法条推荐、罪名预测、刑期预测与相似案件推荐四个子任务。该方法在司法智能建设中能有助于提高法官的工作效率,平衡
论文部分内容阅读
随着法律从业标准愈加严格,从业人员规模的扩大远慢于刑事案件数量的增加,司法机关面临“案多人少”的困难;且法官的自由裁量权受其学识水平、工作经验等主观因素的影响,可能造成“同案不同判”的情况,影响司法公正性。为解决以上问题,本文以刑事判决文书为输入,使用自然语言处理技术,将案情自动化分析分解为法条推荐、罪名预测、刑期预测与相似案件推荐四个子任务。该方法在司法智能建设中能有助于提高法官的工作效率,平衡刑事案件数量、司法机关人力与司法判决工作之间的关系。考虑到上述四个子任务并非完全独立,本文使用多任务学习的方式进行联合建模,利用其间的关联关系,共享判决文书预处理、语义编码等部分,提高本文案情分析方法的泛化能力。具体而言,对于法条推荐与罪名预测任务,考虑到被告人可能触犯多条法条,被判处多个罪名,本文将其视为两个多标签分类任务,使其共享输入层、embedding层以及语义编码层,达到多任务学习的效果,构建法条罪名共现关系库,对预测结果做进一步校正。对于刑期预测任务,本文根据数据分布特点对刑期进行区间划分,使用文本分类的方法预测刑期区间。在与前述任务共享输入层、embedding层以及语义编码层的基础上,本文根据《量刑指导意见》进行规则信息的提取与融入,增加刑期预测的可解释性。对于相似案件推荐,由于缺乏标注数据,本文从法条与罪名维度构建了相似案件库。输入犯罪事实时,依赖法条推荐与罪名预测的结果定位其相似案件库,使用上述任务中训练的语义编码模型对案件文本进行编码,随后计算其间相似度,并据此进行相似度排序与相似案件推荐。本文以CAIL2018数据集为基础,以中国裁判文书网中下载的刑事判决文书为补充,构建实验数据集,一定程度上减少标签分布不均带来的影响。实验结果表明,相比于各任务独立训练,使用多任务学习方式,共享部分结构,能有效提高案情分析方法的效果。
其他文献
中国作为四大文明古国之一,加之近年来经济、文化水平不断发展,国际地位也得到了大幅提升。中华文明历经五千年历史长河,优秀的传统文化经过一代又一代地继承与传扬,在舞蹈文化中蕴含着强大的民族精神。优秀的传统文化是一个国家和民族的灵魂,舞蹈作为我国优秀传统文化的重要组成部分,在文化不断传承与发展的过程中,饱含了传统文化的独特魅力。古典舞作为民族文化的精粹,也在不断的创新与优化。审美意识决定审美标准与价值取
随着公共交通和物流吞吐量的剧增,特别是在节假日期间人员流动量非常大,给人工安检带来了巨大的挑战。利用计算机视觉算法辅助人工安检可以提高安检效率,当前基于计算机视觉技术的违禁品检测算法主要是基于图像分类和目标检测的,无法获取违禁品的轮廓信息,并且还存在违禁品边缘模糊、重叠、以及尺度不一的问题。为了解决这些问题,本文提出了一种基于深度学习的X射线安检图像违禁品分割算法,可以得到违禁品的轮廓信息,从而更
在传统的考试场景中,由老师设计题目,考生作答,最终再由老师进行批改,整个过程中最为繁琐的便是人工阅卷的环节。人工阅卷不仅给老师带来繁重的工作量,而且容易出现批改错误、阅卷周期长的问题,对教学带来不利的影响。随着计算机技术的发展,答题卡中选择题填涂结果的自动识别技术已经被广泛应用。而主观题部分,由于涉及到图像手写文字检测、识别和理解等复杂问题,仍然依赖于人工批改。考生手写文字与试卷本身的印刷体文字分
基于毫米波感知的人类活动识别是实现人机交互的关键技术,例如,利用毫米波传感器对独居老人生活状态进行监测。先前工作证实了利用毫米波传感器进行活动识别的可行性,但在实际应用中还存在问题:大部分系统只能近距离识别而无法远距离识别,系统在噪声环境中识别率较低,以及由于时延较长而无法实时响应。因此,本文基于毫米波传感器,针对上述问题进行研究,研究内容及创新点如下。1.设计了基于毫米波传感器的实时远距离活动识
联邦学习能够使不同数据源(客户端)在不共享数据的情况下,进行深度神经网络模型的联合训练,已成为人工智能领域的一个热门研究方向。但是,传统联邦学习方法面临着设备、数据、模型上的异构性挑战,无法应对不同客户端的个性化特点与需求,导致学习效果下降。为此,本文研究了一种基于交叉注意力机制的个性化联邦学习方法,并面向分类任务进行了系统实现。主要工作包括:1.利用注意力(Attention)机制与客户端自身数
开发人员为提高软件开发效率,通常会复制已有的代码片段,并粘贴或进行微小修改后重复使用。因此,软件系统中经常会出现相似的代码片段,这种现象被称为代码克隆。虽然代码克隆可以提高初始生产力,但它可能会导致漏洞传播,并增加软件系统的维护成本。近年来,代码克隆检测已经成为软件工程领域一个越来越重要的研究课题。最近的检测代码克隆研究表明,基于抽象语法树的神经网络模型比其他方法能更好地表示源代码。研究人员使用基
近年来,随着三维空间(3D)视觉传感器的广泛运用,三维计算机视觉应运而生。在计算机视觉领域,对三维点云进行语义分割,可用于对三维场景的理解。本文将ORBSLAM3以及已有的点云稠密重建开源项目结合,通过3D传感器采集或合成RGBD图像生成局部点云,并利用SLAM跟踪得到的位姿,完成运动中室内场景点云模型的建立。本文对已有点云重建开源项目进行了以下两点改进:一是增加了用于MYNT等双目深度相机的自建