知识引导的司法判决预测研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:sondenaclaire3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
法律文本挖掘是一种从法律领域的文本数据中挖掘出有用信息的计算机自动分析技术,受到了自然语言处理界的广泛关注。法律判决预测(Legal Judgment Prediction,LJP)在法律文本挖掘中具有很高的研究价值,旨在根据案件事实描述来预测判决结果(如适用法律条款、罪名、刑期等)。不仅可以为司法工作人员提供专业的且具有参考价值的法律建议,也可以为有法律咨询需求的非专业人士提供高效价廉的服务。在以往的研究中是将LJP视为文本分类任务,采用深度神经网络(Deep Neural Networks,DNN)方法对文本数据进行分类。尽管DNN在法律判决预测方面取得了成功,但目前大多数方法并没有与法律知识进行很好的结合。因此,将法律知识注入到神经网络来提高模型的可解释性及其性能仍然是一个重要的问题。本课题以法律判决预测中如何将知识进行合理表达并与判决预测模型进行融合为研究对象,提出了基于嵌入的方法并结合先验知识对司法判决进行辅助性分析,分别把知识表示成知识图谱与知识概念两种形式,并与司法判决预测模型进行合理融合的方法,从而实现判决预测模型性能提升。第一,从具有常识知识能力的预训练模型的设计角度,预训练语言模型是基于大规模语料库训练而来的,是具有基本常识知识推理能力,本课题针对主流模型Bert及XLNET进行修改,以实现知识引导的判决预测任务。第二,从显性知识的合理表达角度,针对知识图谱融合到预训练语言模型,本课题采用构造句子树的形式解决表示空间不一致问题,引进软位置的概念及可见矩阵解决知识噪声问题,并在此方案上结合Bert与XLNET模型的特性,进而合理地将知识图谱嵌入到法律文本当中。第三,从隐性知识的合理表达角度,针对知识概念融合到预训练语言模型,本课题通过注意力机制来捕获知识特征,并将法条知识与罪名知识构造成图结构,进而通过知识蒸馏的方式分别提取法条与罪名的可区分性向量,为了进一步区分在同一个图群组里的高度相似的法条与罪名,本文引进了相互指导机制,通过法条与罪名知识的相互指导,从而进一步的区分高度相似的知识,进而提高了判决预测的整体性能。关于在数据集上的测试,我们首先采用准确率(Accuracy)、宏精度(Macro-Precision)、宏召回率(Macro-Recall)和宏F1值(Macro-F1)来作为评测指标,然后分别对基线模型Bert与XLNET及两种知识分别融合到Bert模型和XLNET模型进行测试,最后将两种知识同时融入到基线模型进行混合测试,来验证显性知识与隐性知识在判决预测当中的重要性。实验结果表明,两种知识混合融入到XLNET模型的效果最佳,分别在法条推荐与罪名预测任务上准确率提升了 3.6%、3.9%。
其他文献
为提高分蘖洋葱种质资源的利用效率,利用变异分析、相关性分析、主成分分析以及聚类分析方法对69份分蘖洋葱种质资源的农艺及品质性状进行综合评价。结果表明,69份分蘖洋葱种质资源11个性状的变异系数范围在6.42%~57.04%之间,其中单球质量的变异系数最大。叶片数、株高、冠幅长、冠幅宽、单球质量、单株产量两两之间均呈极显著正相关,而均与球形指数呈极显著负相关;总黄酮含量与株高、冠幅长、单球质量、单株
中国作为一个以工业经济为支柱的经济大国,制造业是我国工业产业的核心源泉,且当前中国的经济快速增长得益于制造业的高速发展。现今,随着新一轮科技产业革命的孕育兴起,我国制造业也站在了一个新的起点上,制造企业为提高生产效率,对设备资源的选用与制造展开追逐赛。由于设备资源的新旧及操作难易程度不同,加之人力资源中新老员工操作熟练度的不同都会影响生产效率。因此,制造业需要科学合理配置制造资源,提高其利用率水平
建立高效液相色谱串联质谱法检测乙草胺、苯唑草酮和氯氟吡氧乙酸在玉米中的残留分析方法及样品储藏稳定性。样品经含0.3%甲酸的乙腈提取,以乙腈-0.1%甲酸+4.5 mmol/L甲酸铵+0.5 mmol/L氟化铵混合流动相进行梯度洗脱,高效液相色谱串联质谱分析。结果表明:在0.001~0.5 mg/L范围内3种农药线性良好(r≥0.9983),3种农药平均添加回收率在76.7%~102.2%之间、相对
根是马铃薯很重要的一部分,而根系吸收活力是马铃薯生长过程中的一个重要生理参数。为探讨马铃薯根系吸收活力与产量及抗旱性之间的关系,以及筛选适合日喀则市马铃薯抗旱高产品种,研究对西藏自治区日喀则市主推品种艾玛系列、引进品种“L0109-4”、当地品种“亚东”以及杂交后代新品系“M1314-09”5种马铃薯规定时间根系活力进行统计学分析。结果表明,根系吸收活力与产量呈显著正相关,根系吸收活力和产量有真实
土石坝的筑坝材料就近取得,其是我国乃至世界水利水电工程建设中应用最为广泛、发展最快的坝型之一。渗流稳定是土石坝安全运行的重要部分,渗流变形或小范围或大范围,严重时形成集中的渗流通道后可能导致坝坡塌陷、坝体沉降甚至溃坝等风险,工程运行管理单位在汛期土石坝的巡视检查尤为重要。针对人手不够、汛期出现的问题需及时分析处理等情况,汉江干流某水利枢纽引进外协单位协助巡检,受过专业知识培训的补充人工参与土石坝巡
丹江口水利枢纽位于湖北省丹江口市境内,是汉江综合利用开发治理的关键性水利工程,是南水北调中线工程的水源水库,发挥着防洪、供水、生态、发电和航运等综合效益。为提高丹江口水库水资源利用效率,201 8、2020、2021年结合降雨预报实施汛期运行水位动态控制等优化调度运用实践,效益显著。对丹江口水利枢纽实施汛期运行水位动态控制过程中所面临的防洪调度风险进行分析,并提出相应的防洪调度管理措施,以充分发挥
舰船领域的研究中,运动特性分析是重点内容,在研究过程中,可以采用非线性数学模型。通过对舰船运动特性的准确分析,能够为运动预报提供可靠依据,从而确保舰船上武器系统的发射精度。不仅如此,舰船的运动预报准确度与舰载飞机起落降的安全性有着密切关联,还能为舰船耐波性的研究提供帮助。在对舰船运动模型进行构建的过程中,可以选用MMG分离模型。基于此,以分离模型作为主要依据,对相关的数学模型进行构建,分析船舶在海
作为当前司法改革的焦点,智慧司法对于构建社会主义现代化法治强国具有重要意义。以2001—2022年中国知网数据库291篇有关智慧司法的核心期刊文献为对象,运用CiteSpace软件对文献出版时间、作者、研究机构和关键词等进行可视化分析,发现我国智慧司法理论研究与国家政策实施联系紧密,研究热点经历了从“大数据”到“人工智能”“算法”的演变;研究群体虽初具规模,但较为分散。后续研究可从丰富研究范式、促
柴油机作为船舶动力系统的核心设备,其运行状态直接影响船舶航行安全。为解决柴油机故障监测与诊断难题,提出一种基于t-SNE-VNWOA-LSSVM故障诊断模型,并进行了台架试验。试验设置了正常工况、供气不足、燃烧提前和单缸断油四种工况。将各种工况采集的缸盖振动信号进行快速傅里叶变换(FFT),提取了13个时域和频域特征,利用t分布邻域嵌入算法(t-SNE)对数据降维、可视化故障特征。最后再结合鲸鱼优