基于自然语言处理的法务服务系统的设计与实现

来源 :中国科学院大学 | 被引量 : 6次 | 上传用户:mybok1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家法制化建设的稳步推进,司法公开化的体制已经逐步形成,裁判文书作为司法诉讼结果的记录载体,已经在网络上全面依法公开。同时随着自然语言处理技术的发展,其与大数据的融合运用变得越来越普及。通过自然语言处理技术来处理裁判文书大数据,挖掘其中潜在的价值是本文的立题出发点。当用户有诉讼需求时,如果能够通过输入自身案情信息检索出相似案情的裁判文书,将会很大程度上帮助用户了解自身案情的责任范围,这种语义上相似案情裁判文书检索的应用。对促进国家法制化建设具有一定意义。本文在裁判文书大数据和自然语言处理技术的研究基础之上,首先设计了裁判文书的关键词抽取算法和文本相似度计算算法,算法旨在抽取裁判文书的关键词信息并用于计算裁判文书语义相似度大小,以这两个算法作为理论支撑,设计和实现了法务服务系统。系统以数据采集层抓取的裁判文书为数据基础,通过信息提取层和存储层来提取和存储裁判文书的关键信息,系统服务层充分发挥自然语言处理技术和大数据融合的优势,实现了向用户提供相似案情裁判文书语义检索等功能,系统各层协调工作,整个设计过程架构清晰,顺利通过功能测试和性能测试,达到了预期的设计目标。
其他文献
随着现代应用程序对内存需求持续增加和处理器与内存之间速度差距不断扩大,处理器中的TLB失效已经成为影响性能的关键因素之一。本文在北大众志网络计算机和Linux操作系统的软
成像光谱仪集成像和光谱于一体,同时采集物体的二维影像和一维光谱信息,使得人们认识和理解物体构形的同时更便于解析其属性。干涉型成像光谱仪近几年来发展迅速,具有高光谱分辨
射频识别技术(Radio Frequency Identification,RFID)是一项从八十年代开始逐渐走向成熟,九十年代进入快速发展的一门自动识别技术,它在物流,交通,运输等领域有着极大的发展前景。
模型检验是对程序或系统使用严格的模型方法证明程序是否满足给定的性质。软件模型检验技术使用谓词抽象的自动化方法解决了整数、实数、循环边界等程序问题,但是对于中断冲突
随着互联网的飞速普及、网络技术的迅速发展,从网络获取信息已经成为人们的一种习惯。但是网络中同样存在着各种不良信息,带来了很多不安全因素。不断增多的网络攻击事件以及网
动态电路的概念自20世纪80年代被提出来,因其具备晶体管数目少、扇入电容小、跳变速度快、流水开销小等优点,而被广泛应用于各种高性能处理器中。自动化所正在承担研发的高性能
数据资源是信息社会中最宝贵的资源之一;科学数据是e-Science 的重要基础。关系型数据通常是经过认真设计和仔细整理的数据,具有更高的价值。大量用户通过网络共享大量关系型数
随着计算机网络的发展和普及,网络安全问题受到越来越多的关注。入侵检测作为一种主动的信息系统安全保障措施,有效地弥补了传统安全防护技术的缺陷,是安全防御体系的一个重要组
学位
目前,网络安全事件层出不穷,网络安全已经成为人们日益关注的焦点。如何对网络进行全面评估,及时修补网络系统安全漏洞,最大限度地降低系统安全风险程度,已成为网络安全领域一个重
学位
本文主要内容如下:第一章介绍了机器视觉的基本概念、组成和市场应用前景;第二章介绍了印刷质量检测的具体需求,国内外研究现状,以及机器视觉成象系统和光源系统的基本概念和