【摘 要】
:
随着司法体制的深化改革在国家政策层面铺展开来,运用机器学习、人工智能技术的司法判决预测(Legal Judgment Prediction,LJP)逐渐成为实现司法智能化的重要环节。从全国司法系统来看,各地纷纷出现的自助判案系统与云法官系统等智慧司法技术慢慢的被纳入司法审判活动中,先进技术与司法实践活动的紧密结合,不仅对智能技术的迭代更新、发展引领具有推动作用,而且将大大减轻司法实践活动中案件数量
论文部分内容阅读
随着司法体制的深化改革在国家政策层面铺展开来,运用机器学习、人工智能技术的司法判决预测(Legal Judgment Prediction,LJP)逐渐成为实现司法智能化的重要环节。从全国司法系统来看,各地纷纷出现的自助判案系统与云法官系统等智慧司法技术慢慢的被纳入司法审判活动中,先进技术与司法实践活动的紧密结合,不仅对智能技术的迭代更新、发展引领具有推动作用,而且将大大减轻司法实践活动中案件数量与专业法律人士实际数量不足之间的矛盾冲突;同时对司法活动各阶段实现智能化,体现司法审判活动客观公正的价值追求极具意义。但在实际应用中,司法判决预测往往会存在以下问题:1)文本数据集不均衡导致预测效果差;2)案情描述文本长,导致长距离依赖问题;3)忽视了在判决结果中的事实认定信息,对于机器而言会导致误判;4)提出的模型缺乏可解释性,没有说服力。基于上述问题,本文首先以机器学习模型为技术支撑,面向司法大数据,针对法律判决预测中罪名预测、法条预测、刑期预测三项子任务,提出了一种基于多任务联合的判决预测模型Law MIT,该模型通过将罪名预测、法条预测以及刑期预测三个子任务联合在一起作为文本分类任务进行研究。在该模型中以词嵌入法实现文本嵌入,以文本卷积实现信息预编码,以Transformer和DAN作为主编码器分别进行编码,对编码后的向量基于注意力权重进行计算,然后通过Attention机制对计算后的向量进行信息分离,从而获得包含差异信息的三个子任务向量;为了进一步提高模型的预测效率,针对智能司法三项预测子任务,分别对相关联的法条、罪名以及刑期关键信息进行编码,并将编码后的向量与子任务对应向量相加,最后输入分类器进行最终预测。通过在CAIL2018-small数据上的实验结果,表明Law MIT多任务联合模型在法条、罪名、刑期预测上准确率分别为90.3%、94.9%、58.1%,预测准确率较目前常见的司法判决预测模型均有一定的提高,证明了Law MIT模型在智能司法判案场景下应用的可行性。其次,为了进一步提升判决预测模型Law MIT的有效性与可行度,本文针对目前机器学习模型普遍存在的“黑盒效应”展开可解释性研究。本文调研了目前常见的可解释性方法,综合考虑之后采取从事后解释的角度出发,以Law MIT在数据集CAIL2018-small中的预测结果进行分析,采用LIME的事后可解释性方法,通过在模型输入数据上进行轻微的扰动,以获取新的扰动数据集,然后以扰动数据集去探测黑盒模型的输出发生何种变化,并通过可解释的稀疏线性模型去模拟黑盒模型的决策,从而实现智能司法判决预测中单个案例的解释说明。同时,为了保证随机扰动在法律案例数据集产生一致的效果,本文在LIME上设置了初始随机值,这样即使模型在面对同一输入的情况下,其生成的扰动效果也是相同的,从而形成相应的数据集,避免了LIME对于判决预测模型解释结果的不可复现性。最后,文中以可视化的方式展示了随机实例中文本特征对于样本预测结果的影响,并针对单个实例对实验结果进行了探讨与分析,进一步增强了模型的可信度。
其他文献
我国是化工生产大国,众多化工品产能居世界第一,为工业生产、交通运输、建筑施工等其他行业的发展提供了重要支撑。然而,化工生产给我国经济社会发展提供强劲动力的同时,也带来了许多安全问题。爆炸事故是化工生产企业最常发生的事故,在国家持续开展各种形式专项整治行动的情况下,爆炸事故仍时有发生,造成了巨大的伤亡损失,影响着化工生产企业的稳健发展。对化工生产企业爆炸事故历史经验教训的研究不够深入,没有充分挖掘历
技术创新是推动经济社会发展的核心力量。针对新形势新特点,抢抓时机攻破核心技术以此来发挥技术创新的推动引领作用,是关乎国家长远发展的重大问题。新兴技术可以看作是技术创新的成果,它触发了技术的变革,不仅给人类社会带来了巨大的变化,而且在改变传统产业形态的同时创造了大量新兴产业。因此,预测和发现新兴技术显得至关重要。当前新兴技术预测研究大多基于专利文本以及新兴技术的外部特征展开,而根据新兴技术产生模式研
目的 分析全髋置换术老年手术患者复苏室苏醒时间的影响因素及护理策略。方法 回顾性分析2019年6月至2021年12月于中山市中医院收治的196例行全髋置换术的老年患者临床资料,根据患者术后复苏室苏醒时间分为>60 min组和≤60 min组,比较两组患者术后并发症的发生情况,对两组患者临床资料进行单因素及多因素logistic回归分析,分析老年患者复苏室苏醒时间的影响因素,并制订护理策略。结果 1
高质量发展是“新时代”的重要主题。城市是国民经济和社会发展的主阵地之一,近年来出现了经济增长动力不足、城区盲目扩张、城乡发展失衡等问题。建筑业作为国民经济的支柱产业,其发展水平一定程度上也反映着城市建设水平。当前部分城市建筑业发展速度也明显减缓甚至出现负增长状态。上述情形表明,城市与建筑业以数量增量为目标的传统发展模式已出现内生动力不足的端倪。本文从高质量和耦合协调视角出发,以系统理论、协调发展理
随着社会经济的飞速发展我国环境问题频发,其中土壤污染存在程度不一、类型复杂、面积分散等现象,是土壤可持续利用的桎梏。为保证土壤资源的有序开发,原环境保护部在2009年提出土壤环境功能区划概念,随后在2011年出台意见要求建立土壤环境功能区划指标体系及完成区划工作,区划问题已成为环境管理领域的关注重点,亟需相关政策引导完善。我国的大气、水、生态区划已完成,而土壤环境功能区划才刚起步,现有研究大多从土
随着大气污染治理政策的相继颁布以及排放管控措施的持续收紧,我国在大气污染治理上成效显著,PM2.5污染浓度整体水平持续下降,但是仍有许多城市PM2.5浓度未达标,同时O3污染日益显现,成为仅次于PM2.5的污染物。O3作为二次污染物,与PM2.5的二次组分具有相同的前体物。因此,研究选择将十四五生态环境规划重要议题——“PM2.5与O3的复合污染”作为研究对象,以探究城市大气污染的高效管控对策。大
一个地区经济的发展与营商环境息息相关,而政策制度环境是营商环境的重要基石。近年来,我国中央及各地方政府均高度重视营商环境建设,以政策为载体,营商环境相关各领域内开展了多项改革。对我国营商环境政策文本进行分析并最终对此进行量化评价,能促进我国完善营商环境政策,从而推动营商环境的建设与优化。在此背景下,本文对我国2003年-2020年以来发布的营商环境政策文本进行了3个研究:(1)从文档级对我国三大经
短文本匹配旨在通过提取两个短文本的特征以预测它们之间的关系。短文本匹配作为自然语言处理领域的基础性研究,其效果的好坏直接影响了如文本蕴含识别、问答系统、信息检索等下游任务的性能。因此,短文本匹配任务作为自然语言处理的一项关键技术受到广泛的关注。目前的短文本匹配研究多聚焦于采用深度神经网络和注意力机制提取两个短文本的语义和交互特征,并通过设计不同的网络结构和交互方式构建短文本匹配模型。尽管现有的研究
中国是矿山灾害多发国之一,矿山开采过程中的采动灾害不仅严重影响开采的正常进行,而且会造成生命财产的重大损失。针对矿山采动灾害进行实时监测定位,对灾害防控有着重要的意义。但现有研究存在着不足,已有矿山监测系统大多基于GPS对时间进行同步,该方式会导致各监测节点时间同步性差。在灾害定位方面,存在着硬件监测和定位方法研究的割裂,使得相关研究在实际应用中受限。此外,矿山开采会形成大量的采空区和地质断层,影
预测和识别具体的国际贸易关系及其演化,可以帮助各个国家和地区知晓当前的贸易形势和明确未来的贸易发展趋势,使各国各地区在提升自身贸易水平的同时降低贸易风险。尤其是在贸易摩擦、新冠肺炎疫情等不稳定因素存在的背景下,整体把握国际贸易关系及其变化情况,有助于实现贸易的高质量和可持续发展,有助于促进本国的经济发展,有助于全球经济的整体复苏。当前,国际贸易网络的相关研究中很少对具体的贸易关系进行预测,且没有考