法律判决预测系统的关键技术研究——罪名和法条预测

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:ouyang0078
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展进步,人工智能已经开始进入到人们生活,从最开始的机器学习,再到深度学习的发展,之前的学者所假设会出现的一系列东西都即将成为现实。人工智能在法律领域的应用是比较热门的研究领域,国家一直对人工智能和法律的结合持有积极的态度。要想将人工智能应用到法律领域的基础是数据,有数据才会有研究的价值,近几年来,中国裁判文书网已经积累了大量高质量的裁判文书,这些数据为研究带来了可能性。近几年来,全国法院审执结案件总数在不断的上升,给我国的司法机构以及执法人员带来了巨大的压力,为了能够缓解这个问题,我们可以尝试使用算法模型进行法律判决预测,通过使用计算机来帮助缓解结案压力。通过计算机进行辅助法律判决预测,不仅能够节省人力物力来针对更严重的案例,而且相对提高了司法的公平公正性,避免了不同法官因为主观性的影响导致同案不同判现象的出现。法律判决预测作为目前的研究热门,目前主要的任务包括法条预测及罪名预测。之前的一些研究是基于案情描述的相似程度,将相似的案例推荐给法官帮助判案。本文通过使用深度学习相关算法模型,将其应用于法条预测和罪名预测问题中,通过调整模型参数得到一个较高准确率的模型。其次,本次研究还解决了法律判决预测中的两个主要问题,一是数据不平衡的问题,二是易混淆罪名的问题。对于法条预测,本文选取了与直接判罪有关的183个法条,是一个多标签文本分类的任务。在进行法条预测时,本文通过将案情描述的文本数据经过一系列预处理之后,通过预训练的word2vec模型将案情描述文本数据转换为计算机所能识别的矩阵。通过应用支持向量机作为基准,使用了CNN、Text CNN、LSTM、GRU、BILSTM及BIGRU模型进行对比,通过参数及模型的对比,最后发现在阈值选择为0.7时,模型效果较好。其中,BILSTM的效果整体优于BIGRU,当阈值设置为0.7时,F1值能够达到85.5%。对于罪名预测,本文以202个刑法罪名为标签,同样也是一个多标签文本分类任务。通过对比参数及模型,发现在阈值选择为0.7时,模型效果较好。其中,BILSTM的效果整体优于BIGRU,当阈值设置为0.7时,F1值能够达到88.02%。目前,法律判决预测中最主要的两个问题是数据不平衡以及易混淆罪名。数据不平衡即低频罪名的数量较少,会导致样本数量的分布不均衡,从而影响预判的准确率。本文通过使用两种方法解决该问题,一是通过补充低频罪名的数据;二是更改模型的损失函数为focal loss,给予难训练、低频率的样本更高的权重。通过使用之前在罪名预测上表现最佳的BILSTM算法,模型的准确率达到了85.17%,比之前高1.1%;F1值达到了89.5%,比处理之前高1.5%。易混淆罪名即会存在定义相似的罪名,通过机器预测时会容易出现错误,针对该问题,本文使用融入案情描述关键词的办法解决该问题。通过使用两种无监督的关键词的抽取办法对案情描述进行关键词抽取:TF-IDF和Text Rank。通过对比实验,发现TF-IDF的效果较好,相对于未处理过的原始单输入模型,经过融入案情描述关键词的模型在几个易混淆罪名上的表现都得到了提升。
其他文献
2018年第四季度,人民银行正式提出“利率走廊初步建立”这一表述,标志着我国利率走廊调控模式实现了从无到有的飞跃。利率走廊模式的建设是我国进行利率市场化改革的重要组成部分,是我国实现货币政策由数量型向价格型调控转型的关键步骤之一。通过利率对货币市场进行调节是价格型调控的典型手段,在货币政策传导和宏观经济调节中发挥着重要作用。而利率走廊作为一种新型的利率调节方法,在全球多个经济体已经取得了比较丰富的
学位
为了维护消费者的权益,让市场在资源配置中起决定性作用,推动车险高质量发展,银保监会研究制定了《关于实施车险综合改革的指导意见》,并于2020年9月19日起开始施行。相比较于上一版的车险,此次车险改革幅度较大,充满了亮点。一大亮点就在于费率厘定。一方面,新的文件将“自主定价系数”和“自主核保系数”整合为“自主定价系数,并将其范围确定为[0.65-1.35]。另一方面,引导行业在拟定商车险无赔款优待系
学位
中国作为人口大国以及老龄化国家,医疗问题是国计民生的主要问题。人工智能以及大数据技术在近些年取得了飞速发展,将人工智能技术引入到医疗领域已经是大势所趋。在中国市场上,医疗行业在人工智能方面相关的投入也逐年提高。据评估,中国医疗人工智能市场规模达到96.61亿元,2017年超过130亿元,2018年超过200亿元,2019年超过300亿元。中国医疗人工智能的市场规模如此快速地增长,主要依赖于医疗资源
学位
随着零售业的管理模式不断发展,传统零售业逐渐向智能化管理转变,新零售时代到来。智能技术赋能供应链升级转型,消费者的消费习惯也随之改变,逐渐由单一线下消费过渡到线上线下融合消费。与此同时,各类大大小小的促销活动也深入消费者心智。对品牌而言,如何在促销季对产品进行合理定价是企业提升收益的关键性问题。由于产品更新换代速度较快,企业面临的产品管理规模逐步扩大,在促销时对大规模产品定价时常面临人工管理成本高
学位
高职英语课程是培养新时代工匠人才的关键公共课程,将劳模精神、工匠精神融入英语课程教学具有重要现实意义。基于课程思政建设的深入推进,高职院校立足于立德树人根本任务,结合英语课程特点融入劳模精神与工匠精神,以此提升英语课程教学育人的实效性。文章以高职英语课程教学现状作为切入点,阐述劳模精神、工匠精神融入高职英语课程教学的价值,提出推动高职英语课程劳模精神、工匠精神融合培育的具体策略,以此构建符合新时代
期刊
随着互联网技术与金融行业的不断融合,互联网金融已经逐渐成为社会关注的焦点。作为传统金融行业的重点领域之一,信贷风控也在逐步与人工智能技术、大数据技术等相结合,以解决随互联网金融的发展而愈发严重的信用风险问题。目前,信贷风控领域开始逐步完善信用体系,信贷业务流程更加合理合规,征信系统与时俱进,风险控制水平在计算机技术的加持下也稳步提升。不过,虽然复杂的风控模型能够在信贷风控领域带来更高的准确性,但是
学位
资本资产定价模型(CAPM)自提出以来,逐步成为了研究资产定价课题的重要理论基础,其认为风险资产的收益可以被系统性风险溢价和非系统性风险溢价所共同解释。系统性风险来源于影响市场上所有资产收益的风险,其往往由经济周期、通货膨胀、货币政策等宏观经济因素所引起,不同的资产与系统性风险的相关性有所不同,其通常用贝塔值表示。进一步的研究发现,宏观经济形势是不断变化的,在现代经济体不同的经济周期之下,风险资产
学位
自1990年中国A股市场诞生以来,随着我国金融改革的不断深化,中国金融市场的不断完善,越来越多的投资者选择进入股票市场进行理财投资。然而由于金融市场中的股票价格是一种极其复杂的非线性系统,再加之A股市场还并未十分完善,因此对A股市场的研究以及股票价格的预测一直是金融界及学术界研究中的焦点。为了能够更加准确地对股票市场进行分析及预测,国内外学者采用过众多经典的经济学模型进行建模,然而由于经典的经济学
学位
随着中国汽车市场近十年来的快速增长,据国家统计局公开数据显示,2019年末全国民用汽车保有量已达到2.62亿辆。自2017年起,与新车市场销量的下降趋势相反,二手车市场呈现出蓬勃向上的增长势头。借鉴国外的成熟汽车市场经验,可以发现汽车产业的健康发展与二手车市场的繁荣是密不可分的,通过旧车淘汰、车驾升级等方式,促进新车生产、新车消费进一步升级发展。随着互联网销售模式逐渐成熟、二手车转籍政策不断放开,
学位
我国航空运输业快速发展,在基础设施和业务量上均有较大的提升,近10年来,民航旅客需求年化增速达到14%以上,维持着较快的增长速度;同时,面对日益激烈的竞争市场,人们也越来越关注客户行为,各行各业的营销重心都从关注产品的本身,向关注客户的行为所转变;此外,随着我国大面积普及计算机,互联网高速发展,计算机技术越来越成熟等条件下,大数据(Bigdata)应运而生,吸引了越来越多的关注,并且在应用方面,越
学位