【摘 要】
:
经过多年的发展,我国法院信息化工作获得了较大的成就,电子化裁判文书就是其中重要成就之一。对电子化裁判文书进行专题分析,成为司法大数据服务国家治理、服务经济社会发展的新方向。通过文献阅读和调研,发现在垂直行业中还未有面向裁判文书的知识图谱构建研究,因此通过裁判文书获取知识,整合知识的工作具有重要的研究意义和应用价值。本文对面向裁判文书的知识图谱构建开展了以下工作:首先在实体识别阶段,针对非结构化数据
论文部分内容阅读
经过多年的发展,我国法院信息化工作获得了较大的成就,电子化裁判文书就是其中重要成就之一。对电子化裁判文书进行专题分析,成为司法大数据服务国家治理、服务经济社会发展的新方向。通过文献阅读和调研,发现在垂直行业中还未有面向裁判文书的知识图谱构建研究,因此通过裁判文书获取知识,整合知识的工作具有重要的研究意义和应用价值。本文对面向裁判文书的知识图谱构建开展了以下工作:首先在实体识别阶段,针对非结构化数据,为了弥补中文命名实体识别的深度学习方法中,未充分考虑输入字序列之间的依赖关系,本文提出了一种将注意力机制与长短时记忆模型相融合、加入词向量的中文命名实体识别方法,通过在标准数据集上的实验结果,表明该方法优于词向量与字向量相结合的深度学习方法,对中文命名实体识别的性能和效率有所提高。同时将以上改进方法应用到裁判文书的行业和标的物实体识别上,通过实验验证其效果。针对半结构化数据,采用正则表达式抽取除行业及标的物之外的实体,无需人工标注。其次在关系抽取阶段,提出了依存句法分析与模板匹配的方法。根据在裁判文书中进行实体识别抽取的律师实体,获取对应在律师365网站上的律师简介文本,编写模板提取律师属性关系,实验结果表明该方法能够有效地抽取实体之间的关系。最后在知识图谱的构建及存储阶段,提出基于裁判文书的本体建模方法。根据类、范围、域、对象属性、数据属性的定义,分析了面向裁判文书的类及类之间的关系,通过protégé对裁判文书相关实体及其关系增加了约束限定,本体即Schema层指导知识图谱的构建,根据本体模型生成的OWL文件中的数据模式将抽取的知识转化为RDF三元组知识,存储在Neo4j图数据库中,生成最后的知识图谱,为法律领域的相关人士提供知识服务。
其他文献
目的:探讨黑蒜提取液抑制胰腺癌Panc-1细胞的增殖与转移的机制,本实验主要研究TGF-β1/Smad4信号转导通路在胰腺癌发展与后期转移中的相关分子的作用与机制。方法:选择胰腺癌
再保险是一种新型且有效的风险管理工具,保险公司可以通过购买再保险合同来有效的降低因为偿还债务的能力不足导致破产的风险.随着风险管理策略的发展,为了平衡保险公司与再保险公司之间的利益,越来越多的学者对最优再保险问题进行了研究.很多文献都是考虑保险公司的利益,基于期望保费原理,通过最小化VaR和CTE风险度量研究最优再保险的问题.众所周知,保险公司和再保险公司的利益是冲突的.因此,本文考虑到再保险公司
STS教育是在现代科学技术迅猛发展和社会呈现巨大变革的背景下出现的,它注重科学、技术、社会三者关系的协调,强调培养学生从社会的大背景下去理解科学与技术。当前我国素质
近年来,双旋翼碟形飞行器以其结构紧凑、机动性强、气动效率高等突出优点,已经成为学者们的研究热点。然而,对于传统的双旋翼共轴式飞行器存在气动布局结构复杂、组成零件多,升力最大化受到机体尺寸限制,控制机构存在惯性大、控制灵敏度较差的问题,不能充分发挥气动系统的优势。基于此提出一种新型喷气式双旋翼碟形飞行器,以其气动布局和控制系统两方面展开了喷气式双旋翼碟形飞行器的结构设计及性能研究,对双旋翼飞行器的性
目的:观察胃癌组织中鸡卵清蛋白上游启动子转录因子Ⅱ(COUP-TFⅡ)和神经纤毛蛋白2(NRP2)的表达变化,并分析COUP-TFⅡ、NRP2表达与胃癌临床病理参数的关系,并利用细胞实验证明
网络技术的飞速发展使得信息交互变得更加便捷和高效,图片作为人们在日常生活和工作中常用的信息交流媒介物,其携带的文字信息是该图片的主要关键信息。在人们的日常工作和学习中,会接触到各式各样的证件、票据以及特定结构的文档等等,常常需要将上述文件中的关键信息提取出来录入成电子化。在电子化的过程中,图片转换成文字是核心内容,若通过键盘输入,则需要耗费大量时间和成本,在O CR(Opti cal Charac
论文首先介绍系杆拱桥的特点、国内外发展现状和结构形式;概述跨度112m城市组合桥面系杆拱桥的设计方案以及主要构件的设计参数;运用有限元软件Midas/Civil建立的梁单元全桥模型,用梁单元模拟横纵梁和拱肋,用桁架单元模拟吊杆和系杆,用板单元模拟桥面板。模拟组合桥面系杆拱桥的施工过程,分析施工阶段桥梁各部件的变形、内力以及应力。将恒载、活载、温度、风荷载等作用进行组合,以最不利工况进行加载,计算分
并购是企业做大做强和实现企业战略的重要途径之一,中国企业在国家政策的号召下以及企业自身转型升级需求的驱动下,并购步伐加快,并购交易数量和金额也在不断增加。然而企业并购之后的绩效问题也逐渐引起人们的普遍关注,本文选取了楚天科技并购四川医药设计院的案例,深入研究和分析楚天科技在并购四川医药设计院后的绩效问题。本文结合国内外以往的研究情况,首先采用事件研究法评估科技的短期绩效,通过选取并购发生日前后的4
表达不流畅是人类语言活动中的一种常见现象,流畅的表达能让听众更愿意去倾听,也更愿意去相信讲者。而在交替传译活动中,译语产出的流畅性是衡量译员表现的最重要标准之一。
硒(Se)是人和动物-维持机体正常生命活动的一种必需微量元素。缺硒可引发多种器官组织损伤并导致多种营养代谢性疾病,如渗出性素质。骨骼肌是硒缺乏主要的靶组织之一。在机体内