法律裁判文书语义检索与分类画像研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户：rambo0316

【摘要】

：

随着中国指导案例制度的建设和法律裁判文书的获得途径越来越多,对于待判案件参考援引案例的方法在诉讼途径中受到广泛的使用。但是,目前现有的裁判文书检索系统中只能从裁判

【作者】

：

朱婷

【出处】

：

中南财经政法大学

【发表日期】

：

2004年期

【关键词】

：

词向量句向量相似度聚类语义裁判文书智能法律

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着中国指导案例制度的建设和法律裁判文书的获得途径越来越多,对于待判案件参考援引案例的方法在诉讼途径中受到广泛的使用。但是,目前现有的裁判文书检索系统中只能从裁判文书的浅层字面进行查找,在很大程度上忽略了案件语义上的关联性,未充分利用现有的法律裁判文书资源,同时,在现有的法律裁判文书的分类里,缺少在语义级的分类方式。针对当前法律裁判文书在语义挖掘上的欠缺,提出了NLP(Nature Language Processing)+法律的概念。首先,在大规模法律裁判文书语料的基础上,使用分布式集群框架Mapreduce和Hive数据仓库作为支撑,使用了基于负采样的skip-gram算法进行建模得到表征语义的词向量,然后提出随机漫步算法和平滑逆频率SIF建模得到表征文本上下文关系的句向量,最终实现将法律裁判文书表示成分布式高维向量,使用向量之间的余弦距离来衡量法律裁判文书之间的相似性,从而选取高相似性的案件作为待判案件语义级的援引案例。实验表明,基于句向量的相似案例查询具有较高的语义匹配程度。其次,通过构建法律裁判文书向量库,使用基于句向量的k-means算法和birch算法进行聚类,经过使用轮廓系数作为评价指标对比两种算法的聚类效果。实验表明,birch算法聚类效果更好,且其将现有的30万篇劳动争议的法律裁判文书划分为6个类簇,然后再在每个类簇里基于词向量提取关键词列表,将该关键词列表作为对应类簇的标签,从而构建法律裁判文书语义级分类画像。本文的创新点概括如下:一、不同于传统的词向量的加权平均和复杂的神经网络方法,采用了随机漫步算法和平滑逆频率SIF的方法构建句向量,优化了传统方法上忽略了语义的问题,也避免了神经网络方法构建上的复杂性和训练的耗时性;二、在提取簇类的关键词作为标签之前,使用了基于句向量的聚类。在聚类的基础上再次使用基于词向量的关键词提取方法,两次深度挖掘了文本语义上关联性;三、作为将NLP自然语言处理深度学习大胆尝试在法律领域,提出了NLP+法律的应用场景,在文本相似性的计算过程中贴合法律的实际应用场景进行了不同权重的分配,提出了侧重于各法律裁判文书要素的语义相似性查询,提升了NLP在法律领域提供援引案例的实用性,并构建了一套全新的法律裁判文书语义级分类画像,为充分利用丰富的法律裁判文书资源提供了新的思路。总的来说,使用神经网络的方式进行法律裁判文书的词向量建模,以及使用随机漫步模型和SIF构建句向量,能够更好的提取文本的语义信息,能够提升后期文本相似度查询和聚类分析的效果,促使自然语言处理在法律领域的应用更进一步。

其他文献

联用头孢哌酮舒巴坦钠和左氧氟沙星对合并肺部感染的COPD患者进行治疗的效果研究

目的：探讨联合使用头孢哌酮舒巴坦钠和左氧氟沙星对合并肺部感染的COPD（慢性阻塞性肺病）患者进行治疗的临床效果。方法：对2012年1月~2015年10月期间我院收治的80例合并肺部感染的

期刊

COPD肺部感染联合头孢哌酮舒巴坦钠左氧氟沙星效果

基于高分遥感影像纹理空间模式增强的非参数化茶园识别方法研究

中国是全球茶叶种植和生产大国,茶园不断扩张带来经济效益,也造成土壤侵蚀等生态问题。茶园是农业生态系统的重要组成部分,但对其的监控却不及农田,因此,能及时准确地获取茶

学位

茶园影像纹理空间点模式面向对象目标探测纹理强度

基于取送货一体的S公司产成品运输路径优化研究

近几年来,国内外的互联网企业纷纷加入到了硬件产品制造的行列,这类企业依托于互联网的优势,可以更好地制造产品,但是在产成品的运输过程中往往存在运输成本高,运输效率低等

学位

取送货一体产成品运输车辆路径优化

龙眼：益寿抗衰

龙眼：益寿抗衰文／保国龙眼，又名桂圆，是我国历史上推崇的四大名果之一，素称“益寿神品”。明代画家宋珏在《荔枝谱》中曾对龙眼做了出神入画的描述，龙眼“圆若珠，赤若金丸，肉似玻璃，核

期刊

糖水龙眼罐头《神农本草经》抗衰老作用子宫颈癌细胞博莱霉素抗癌化疗药物黄素蛋白酶国际市场《荔枝谱》速冻龙眼

论邓小平国际战略思想演进的三个阶段及其重要意义

邓小平的国际战略思想形成于党的十一届三中全会后到上世纪九十年代初，有着独特的历史轨迹和内在的逻辑结构，大致经历了三个阶段：第一阶段：实现了国际战略指导思想的巨大转变——

期刊

邓小平国际战略思想和平与发展“有所不为有所为”

构建城乡统筹基层党建新格局——重庆试验的基本途径和示范意义

统筹城乡发展需要组织保障和协同。重庆市开展构建城乡统筹基层党建新格局的基本途径，就是着力整合城乡党建资源，试图建立城乡组织设置、干部人才、服务群众、党员管理、党内关

期刊

重庆城乡统筹基层党建基本途径

500kV集中监控系统保护信息分层分类规范与实现

500kV无人值班站发生事故时,主站系统会收到厂站大量上送的保护信息。对这些信息进行合理的分类分层控制,有利于各职能人员实时监视与事故判断。提出了对保护信息进行合理分

期刊

500kV无人值班站集控保护一体化集中监控系统信息分层分类

THE VARIATION FEATURES OF AGROCLIMATICRESOURCES AND CROP YIELD OF CHINAIN RECENT 40 YEARS

ＴＨＥＶＡＲＩＡＴＩＯＮＦＥＡＴＵＲＥＳＯＦＡＧＲＯＣＬＩＭＡＴＩＣＲＥＳＯＵＲＣＥＳＡＮＤＣＲＯＰＹＩＥＬＤＯＦＣＨＩＮＡＩＮＲＥＣＥＮＴ４０ＹＥＡＲＳＧａｏＳｕｈｕａ（高素华）ａｎｄＺｈａｎｇＹｕ（张宇）ＲｅｓｅａｒｃｈＣｅｎｔｅｒｆｏｒＡｇｒｉ...

期刊

agroclimaticRESOURCESCROPYIELDCLIMATICchangeagroclimatic resources crop

中德工科院校实践教学体系比较研究

第四次工业革命浪潮带来的智能时代已经到来,全球产业的格局正呈现着以人工智能、大数据、3D打印制造、新能源等新技术为核心的新科技革命发展趋势,产业界对工程人才培养质量

学位

工科院校实践教学体系比较研究

党建统领煤炭企业安全生产的思考与探索

十八大以来,党中央作出了全面从严治党的重大战略部署,对国有企业党的建设工作也提出了一系列新要求。国家能源神华神东煤炭集团公司深刻践行党中央工作要求,对当前企业党建

期刊

国有煤炭企业党建工作哈拉沟煤矿基层党支部企业安全生产思考与探索

法律裁判文书语义检索与分类画像研究

与本文相关的学术论文