基于罪名预测的相似案件推荐——以侵犯财产罪为例

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:wangzixiaoxun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
依法治国是我国的基本国策,近年以来法制建设不断推进,人们更加习惯于将问题诉诸法律,各类诉讼案件不断增加,部分法院存在审判工作压力大、审理周期长、人员紧缺等问题,在司法程序提升处理案件的效率显得尤为重要。并且随着我国经济社会不断发展,社会财富逐渐积累,中等收入群体日益扩大,人们对财产安全和稳定的需求也越来越迫切,需要对财富足够的安全感以稳定预期。因此精准的相似案例推荐对于法律判决有着重要作用,是司法智能化的重要环节,对依法保护人民财产安全有重要作用。本文首先介绍了论文涉及的相关理论与方法,包括财产犯罪的相关概念、深度学习模型以及推荐系统方法。其次使用BERT-LSTM模型解决案件的分类问题,以侵犯财产罪的法律判决书为研究对象,对数据进行类别平衡与降噪处理后,通过BERTLSTM模型对进行快速有效地对案件进行分类,完成罪名预测任务。实验结果表明,罪名预测的精确率为0.9448,宏平均F1分数为0.9401,精确率为0.9398,召回率为0.9411,在罪名预测任务上得到了较好的结果。再次以侵犯财产罪的法律判决书为研究对象,从法律要素角度,提出了相似案件的评价指标,将案件的相似性分为5个等级;最后以此为评价指标在第二章罪名预测模型的基础上进行Sentence-BERT的微调,由此得到法律案件事实描述的向量化语义表征,通过余弦相似度获得最终相似度并生成推荐列表。实验结果表明,由Sentence-BERT句向量进而计算相似度得到的推荐列表在Spearman秩相关系数上达到了0.7621,远高于基线模型,在NDCG@10指标达到0.9261,对比基线模型,NDCG指标整体提升了10%左右;并且分别对于“抢劫”和“敲诈勒索”这两个常见罪名采用示例生成推荐列表,从案件要素和刑期角度,推荐列表中的案件与查询案件相似度较高,生成的推荐列表质量较高,可以满足法律工作者的需求。本文结合使用的BERT-LSTM罪名预测模型与Sentence-BERT句向量表征,构建了基于罪名预测的相似案件推荐,在用BERT-LSTM模型对法律判决书进行罪名预测后,从相同罪名标签的数据库中依据Sentence-BERT进行语义表征和相似度计算,生成top N推荐列表,推荐列表质量较高,可以从法律要素和语义层面生成相似案件列表,推荐给法律工作者需要的案件;本文丰富了法律相似案例推荐的研究,为推荐算法在法律领域的应用提供重要的实证素材。
其他文献
2020年,我国最高人民法院和武汉市中级人民法院接连在标准必要专利诉讼中依据知识产权行为保全制度,实质上签发“禁诉令”,表明了我国建立标准必要专利诉讼禁诉令制度的现实需要。我国尚未建立禁诉令制度,面对我国当事人申请签发禁诉令的需求,我国法院只能通过适用知识产权行为保全制度来应对,但是知识产权行为保全制度并不能与禁诉令划等号,二者的理论基础、适用条件存在着极大的差异,并且其与国际上的禁诉令制度无法完
学位
传统理论一般认为,反垄断争议是具有公法性质的争议,是国家司法领域的故有领地,必须通过法院进行裁判,不可以通过仲裁方式进行解决。党的十八大以来,国家加大了对反垄断的执法力度以及相关行业的整治,反垄断争议层出不穷,且案件数量持续增长。尽管现行争议解决机制在一定程度上发挥着重要作用,但因其自身具有的局限性导致无法发挥最大作用,例如反垄断争议行政执行解决方式无法克服行政执法机构地位边缘化、执法手段单一、执
学位
高新技术产业,是国民经济体系中不可或缺的产业,是我国经济发展的重要倚靠,具有广阔的发展前景。十九大汇报中指出我国要到二〇三五年步入创新型大国队列,高新技术产业成为建立社会主义创新型大国进程中的关键主体,它的发展关乎着国家创新发展。高新技术产业创新绩效的高低代表着产业发展水平,故,研究高新技术产业创新绩效有着重要的价值。同时,近年来,国家大力发展数字经济,“数字经济”这一概念在理论和实践中都被广泛使
学位
2022年3月国家互联网信息办公室等四部门联合发布了《互联网信息服务算法推荐管理规定》,指出推荐算法需要对个人信息依法予以保密,不得泄露或非法向他人提供。推荐系统为用户在海量数据中提供精准的选择,但在这个过程中会收集到大量的用户信息。一方面,推荐模型需要大量的有效用户标注数据来进行模型的训练,推荐系统的准确度和个性化程度都与其掌握的个人信息成正比。另一方面从个人信息保护的角度来说,将个人数据上传到
学位
随着全球地理信息技术的发展,地形数字化已经影响到了各行各业。而数字高程模型(Digital Elevation Model,简称DEM)作为一种基础地学模型,不仅能实现地形的数字化模拟,更影响着一系列基于DEM的基础地学实验。但是,就现阶段而言,高质量的DEM很难获得,因为这个过程十分的耗时而且昂贵,并且高精度数据的获取也十分受到限制。但是,如果使用机器学习技术解决这个问题,就可以低成本、高效地生
学位
异步审理模式为我国首创,并经三大互联网法院积累了大量的实践经验,取得了突出的实践效果,在很大程度上节约诉讼成本,提高诉讼效率。但截至目前,除最高人民法院颁布的《人民法院在线诉讼规则》之外,尚无其他法律法规做出相关回应,实践中也存在很多问题,亟待进一步解决。本文试图以互联网异步审理的基本问题分析为基础,围绕互联网异步审理的理论与实践进行研究。“异步审理”是指经各方当事人同意,人民法院可以指定当事人在
学位
在互联网高速发展的今天,游戏产业也顺势发展,现已经成为了用户规模巨大,经济增长极快的行业。截至2021年1月,中国游戏用户规模达到了6.65亿人,游戏收入方面,去年全年中国游戏市场实际销售收入2786.87亿元,而距今为止最为突出的移动端游戏当属游戏《原神》,上线6个月后仅仅在移动端就从全球获取到超过10亿美元的营收,可以说是创造了移动端游戏的奇迹,随着游戏刚开服的新鲜感已过,如何实现游戏的长久发
学位
股票市场不仅能让投资者从中获利,还能够体现宏观经济的信息,所以无数的投资者和研究学者都在不断探索如何更加精准地捕捉股票序列中蕴含的信息,用来对股票序列进行预测,无数学者的研究证明了将机器学习模型应用到股票市场上相比传统的统计学方法能够获得更高的精确率,因此机器学习模型已然成为股票市场领域的重要研究工具。中国股票序列波动较大,预测也相对比较困难。前人对股票序列的预测做过很多工作,本论文选择上证50指
学位
近年来,电商行业发展蓬勃,消费者通过电商平台实现了便捷购物的同时,在购买商品后通过发表评论来表达自己对所购商品喜欢或者讨厌的情绪也成为了一种购物习惯,因此电商平台上积累了很多用户评论。对企业来说,用户评论可以反映商品的不足,但其中发表的投诉或抱怨信息也会给企业形象产生负面影响。企业竞争从激烈的红海战略转向以用户为中心的蓝海战略,企业形象成为了各个企业关注的重点,良好的品牌形象是企业竞争的有力武器,
学位
一直以来,审计意见都是证券市场上衡量某一企业是否能持续经营,是否符合市场融资规定的重要参考因素,它不仅要求被审计单位出具公允的,真实的财务数据,同时也关系到市场上投融资活动的有序进行。而对于缺少固定资产的科技型企业来说,融资活动是其产品创新研发和持续经营发展的关键一环,关系到融资效果和质量的审计意见类型也就显得尤为重要。同时,科技型企业已成为中国科技事业发展的中坚力量,对中国经济成长质量的提高和中
学位