结合法条的司法裁判文书摘要生成方法研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:kisswc69
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
裁判文书是记载人民法院审理过程和裁判结果的重要法律文书。随着国家司法体系的不断完善,人民法律意识的不断提高,司法案件也在逐年增多,相应的裁判文书数量随之大量增加。相关人员快速从海量案例中搜索、了解所需指导性案例的难度日渐增大;研究一种司法裁判文书的自动文本摘要方法,帮助相关人员快速从海量案例中搜索、了解所需的指导性案例,提高审判人员工作效率,具有非常重要的研究意义和应用价值。司法裁判文书摘要生成任务旨在从裁判文书中自动抽取出能够反映主题的精简压缩版本。法条作为裁判文书重要的组成部分,在文书内容和文书语义结构上均发挥着重要作用。传统摘要生成方法应用于司法领域时没有考虑裁判文书的特点,忽略了法条在其中的重要作用,导致生成的摘要容易丢失重要信息,降低摘要生成性能。本文从法条这一审理逻辑脉络的重要组成部分入手,综合考虑裁判文书中重要内容和裁判依据与法条之间的共现关系,从传统自动文本摘要的角度出发,研究融合法条的司法裁判文书摘要生成方法。论文主要工作如下。(1)融合法条的生成式裁判文书摘要方法:通过研究司法领域裁判文书的文本结构和语义逻辑,挖掘法条在法官审判逻辑脉络中与案件重要内容的关系;利用法条具体内容,构建基于法条语义的外部知识编码器,将法条融入裁判文书摘要生成过程,辅助引导裁判文书的摘要生成过程,进一步保留摘要生成过程中的重要信息,提高模型摘要生成性能。(2)融合法条的分段式裁判文书摘要方法:基于融合法条的生成式裁判文书摘要算法的研究,考虑到长文本裁判文书在生成式模型中的语义丢失问题,构建“抽取+生成”的分段式摘要生成模型;为了缓解抽取阶段融入法条带来的冗余信息对抽取阶段模型性能的影响,采用强化学习对抽取和生成模型进行联合训练,使抽取模型根据最终生成的摘要自适应调节,且不影响生成模型阶段;有效提升了抽取阶段模型和整体模型的性能。
其他文献
随着信息技术的迅速发展,产生了大量非结构化文本数据,其中隐藏了许多有价值的信息。信息抽取旨在帮助人们从海量数据中自动化抽取所需信息,因此这项技术可以运用到诸如经济、新闻、生物医学等具有大量数据的领域中。近年来,公开发表的生物文献呈指数级增长,面向生物领域的信息抽取研究与应用愈加迫切。然而,不同领域的文本特点存在明显差异,例如在生物文献中存在大量蛋白质、药物等专有名词,提取这些生物实体之间的交互关系
学位
随着卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉领域的快速发展,目标检测、目标跟踪等领域取得了重大进展,人头检测也广泛应用于生活中,如景区的人流量统计,地铁站、高铁站的客运量统计等。人头检测是行人检测的一种特殊检测方式,复杂场景下的行人检测存在着行人遮挡问题,如行人与行人、行人与物体之间的遮挡。众所周知,与人体的多变性相比,人体的头肩区域的形状变化
学位
在对儿童青少年的教育中,只有知识教育、技能教育和智慧教育是不完整的,还应有灵性教育。灵性生命教育应作为最高教育目标之一。本文通过临终关怀达成医学、心理学、教育三方整合的灵性生命教育模式。
期刊
<正>美术区域活动能让幼儿通过自身的操作与环境、材料、同伴互动,能让幼儿遵循自己的兴趣、意愿和能力,自主表达自己的想法与创意。所以,如何使美术区域活动真正成为幼儿解放天性、激发灵性、释放悟性的创意乐园,是值得我们探究的课题。一、巧创环境,解放天性,让美术有"趣"
期刊
近年来,随着经济的不断发展,用电需求也在不断扩大,煤炭等自然资源的消耗量不断增加,发展清洁能源被提上了日程,在此期间风力发电技术得到了极大的发展。三相电压型脉冲宽度调制(pulse-width modulation,PWM)整流器作为一种优秀的电能变换器,具有低畸变率且可调的直流电压等特点。PWM整流器电网侧的常用控制策略为以直流电压为外环、交流电流为内环的双闭环控制结构,传统的PWM整流器的双闭
学位
毒品成瘾是一种慢性、复发性的脑部疾病,已成为严重危害人民身体健康和社区安定的主要因素之一。对患者吸毒成瘾尤其是对复吸问题的防治,目前尚未具有行之有效的方法。磁共振成像(magnetic resonance imaging,MRI)技术是研究成瘾的主要手段之一,但现有研究大多数集中在利用单模态磁共振图像去探索成瘾脑结构或功能的变化,如何充分结合多模态影像信息,找到可靠的成瘾影像标记是未来研究的主要趋
学位
新闻是人们获取信息的重要途径,但是新闻中常穿插着假新闻进行传播。近年来随着互联网的发展,假新闻传播变得更加猖獗,因而假新闻检测成了一项迫在眉睫的研究任务。目前为止,共分四个方向对假新闻进行研究,分别为基于知识库、基于行文风格、基于立场以及基于传播途径。在社交网络上,假新闻为吸引流量和引导舆论方向,常使用有着明显差异的行文风格特征,基于这些差异性的行文风格特征已产出一定的研究成果,传统的基于行文风格
学位
广西北海涠洲岛作为我国最大、地质年龄最年轻的古火山海岛,在海岛旅游发展的驱使下,逐渐成为北海旅游的重要吸引物和休闲旅游度假胜地。随着涠洲岛旅游的纵深发展,旅游对岛屿上社区居民的获得感逐渐产生深远的影响。当前,在共同富裕战略目标的指引下,如何理解和提升海岛旅游目的地居民的获得感,对这一目标的实现具有重要意义。为此,文章以北海涠洲岛居民为分析对象,基于扎根理论,对其旅游获得感进行建构,提出了居民的获得
期刊
随着中东部地区煤炭资源逐渐枯竭,西部煤炭能源迎来长久的发展契机。贵州省作为代表性地区,煤矿大都处于低中山垄脊地貌,地质构造极其复杂,煤层赋存层数多,由于煤矿企业长期粗放经营模式,导致地表沉陷或山体滑塌、煤矸石污染等一系列环境问题愈发突出。固废膏体充填开采是一种资源回收率较高的绿色开采方法,可有效控制上覆岩层运移与地表沉陷,保护矿区周边环境。当前,充填开采在贵州矿区难以推广,究其根本是成本过高。充填
学位
伴随着互联网技术的快速发展和广泛应用,数字医学影像在医疗诊断和临床治疗中的应用越来越广泛。而作为数字载体的一种,数字医学影像一方面能够借助互联网和计算机技术实现远程诊断,有效提高医生的医疗诊断水平、满足大众的医疗卫生需求;另一方面,数字医学影像在互联网络传输过程,如果未对医学影像进行有效的版权保护,极容易受到未授权拷贝和恶意篡改的风险,这一行为不仅侵犯了病人的隐私,也对临床诊断带来了险恶影响,因此
学位