国家法律库检索系统的设计与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:bbschengpengfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
法律检索是帮助法律专业从业人员提高工作效率,帮助普通公众了解法律的重要手段。然而,现有法律检索系统主要依赖于专业用户的检索技能来保证检索效果,检索技术相对落后。法律检索中存在两个关键问题尚待解决:  检索结果定位不准确:用户检索的目标是寻找相关法律条文,而检索只能返回整部法律。  不能识别查询和相关文档之间的语义关联:检索基于关键词匹配,无法处理查询和相关文档之间的词不匹配问题。  为了提高法律检索的效果,实现面向法律专业从业人员和普通公众的权威、准确、易用的法律检索服务,论文在分析法律特点的基础上,设计并实现了基于国家法律库的分布式法律检索系统。并针对法律检索中的两个关键问题,提出了细粒度法律检索和基于主题模型的法律领域查询扩展两个可行的解决方案。  细粒度法律检索方法在分析法律文本特征的基础上,提出了法律文本结构识别和条文化拆分方案,建立以条文为基础的法律细粒度索引,使检索结果直接定位至相关条文;结合法律特征,综合文本相似度和法律效力、时效性因子,优化法律文档相关度排序;以实现符合用户检索目标的定制化法律检索。  基于主题模型的法律领域查询扩展方法,利用主题模型挖掘文档在语义层次上的相似性,并基于主题模型计算生成合适的语义扩展词,以帮助检索系统识别原查询的语义信息;利用自动生成的法律领域停用词表,优化主题模型特征选取;通过主题词语分布和上下文共现筛选扩展词语,并结合主题模型调整扩展词语的权重,在兼顾扩展词语语义的同时,减少语义漂移;综合提升法律检索对查询语义的识别和检索效果。  通过对法律检索系统的规范化测量评估实验表明,结合了主题查询扩展方法的细粒度法律检索在召回率及Precision@N指标上有着明显的提升,能够有效地提升法律检索的实际效果。
其他文献
虚拟植物是应用计算机模拟植物在三维空间中的生长发育状况,是虚拟现实技术在农业领域的应用。其核心内容是生长模型和可视化技术,生长模型反映植物形态结构的动态变化,可视化技
一词多义是普遍现象,而且随着时代的发展和语言的丰富,词义在使用中随时在变化着,这是语言学家也无法准确把握或预测的现象,本文利用索引系统对实体名词的多义进行了分析,希望可以
互联网的飞速发展,信息的迅速膨胀,使得互联网中的网页数量呈指数级别增长。据Google的官方博客公布的最新数据,目前世界网络中存在的网页的数量已经达到了万亿的量级。网络信息
随着XML数据量的不断增加,提出了XML文档的不同存储方法。目前存在的XML数据的存储模式主要可以分为两类:关系存储模式和native存储模式。虽然我们将XML存于数据库当中,但目前的
无线传感器网络综合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,能够协作地完成实时监测、传感和采集目标对象的信息,并对其进行处理,传送给需要信息的用
在信息技术以及应用需求的推动下,以提供空间分析服务为核心的地理信息系统(GIS,Geographic Information System)得到飞速发展,其应用领域不断向广度拓展,逐渐渗透到电子商务、电
操作系统异常主要包含操作系统资源占用异常和操作系统中进程的运行异常,而这些异常往往都是因为外界用户采取的种种攻击手段、程序的自身漏洞、程序被非法篡改或注入恶意代码
一直以来,计算机仿真都是人们研究的热点问题。布料运动仿真作为其重要组成部分,也吸引着越来越多的研究人员。单纯的布料仿真不足以应对各种场合,必须配合一定的CAD手段才能实
随着Internet的不断发展,网格作为一种整合资源协同工作的技术成为当前一个研究热点,应用范围扩展到很多领域。本文关注生物计算领域中的两种生物计算服务:PREISO和BLAST。PREIS
无线移动ad hoc网络中节点移动的特性,给网络带来了匿名威胁,恶意节点可以通过追踪路由包的传输分析出路由路径,还可以通过追踪节点的收发包信息分析出节点的位置信息。本文探讨