诉辩文本争议焦点识别方法研究与应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:liongliong497
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智慧司法概念的提出及司法公开平台的建设,促进了司法领域信息化进程的发展。随着以裁判文书为代表的司法大数据不断公开、人工智能技术不断突破,在司法人员处理案件效率的环节,通过人工智能技术有效使用海量数据解决司法问题逐渐成为法律智能研究的热点。目前,在智慧司法方面的研究主要集中于法律判决预测、相似案例匹配、法律问题解答等,争议焦点识别作为司法领域中的一项基础任务,对于庭审质量、审判效率的提高具有重要意义,能够达到支撑智慧司法建设的效果。本文主要采用深度学习方法对诉辩文本的争议焦点识别问题进行研究,在研究过程中对所使用的方法进行比较与分析,并结合实验结果、文本特点等方面对模型进行改进。针对诉辩文本具有文本长度不一、部分文本长度过长的特点,本文提出将其匹配为诉辩句子对进行研究,本文的主要研究工作如下:(1)提出基于BERT-CBGA的矛盾检测模型。首先定义诉辩句子对的矛盾检测任务,实现深度学习模型在其中的应用,其次通过分析检测错误的文本并对Word2vec不能解决多义词的缺陷进行改进,提出基于BERT-CBGA的矛盾检测模型。模型使用BERT训练句对向量,联合CNN与BRNN+ATT进行特征提取以得到更好的语义表示,实验在根据CAIL2020论辩挖掘赛道两阶段数据构建的矛盾检测数据集上进行,检测准确率在测试集上的平均水平达到86.20%。(2)提出基于矛盾检测与分类的诉辩文本争议焦点识别模型。针对诉辩文本争议焦点识别问题,首先实现深度学习模型在其中的应用,其次根据诉辩文本具有长度较长不易于模型理解深层语义的特点,提出一个基于矛盾检测与分类的端到端模型,分别注意诉辩文本段落级及句子级的语义信息,联合使用矛盾检测与矛盾分类的结果。实验使用来自中国裁判文书网并由法学专家进行标注的数据,识别准确率在测试集上的平均水平达到86.98%。(3)设计并实现一个诉辩文本争议焦点识别系统。根据系统的需求分析与总体设计,基于本文提出的两个模型实现了对诉辩双方文本进行分析,从而识别双方全部争议焦点的系统,在系统的实际场景下对模型的应用进行了测试,初步解决了诉辩文本争议焦点识别问题。
其他文献
传统的单聚类方法是依据样本的相似度,将具有相似属性或特征的样本归为一类。然而,随着样本数和特征数的大量增加,单聚类方法的时间成本变得难以想象。另一方面,大型数据集内部数据成分复杂且往往呈现稀疏性,单聚类方法不能很好地处理大型数据集的噪声干扰。基于低维数据全局搜索的单聚类方法不能很好地适应于高维数据和大型数据的聚类问题。为克服单聚类方法存在的缺陷,双聚类方法应运而生。不同于传统单聚类方法,双聚类方法
驾驶风格主要指驾驶员的驾驶习惯,多通过驾车时的行为特征进行定义。驾驶风格与智能交通、无人驾驶、保险理赔都有着千丝万缕的联系。针对现今驾驶风格识别研究多存在数据来源不真实、考虑因素不全面、无法对驾驶风格进行整体把握等问题,本文通过采集真实的驾驶数据,以工况作为驾驶风格识别的最小粒度,构建了基于半监督学习的多工况驾驶风格识别模型。主要工作如下:1.搭建驾驶风格识别数据库。通过对日常驾驶风格影响因素的深
蛋白质是生命活动的重要物质基础,也是生命活动的执行者和调控者。少数蛋白质可以在生物体中单独执行特定功能,大部分蛋白质通过与其他蛋白质之间的相互作用以复合物的形式完成其特定功能。因此,精确高效地识别蛋白质复合物对于揭示细胞组织原理和功能机制具有重要意义,且对复杂疾病的诊断与靶向治疗具有一定的指导作用。本文基于生物信息学理论与机器学习算法,对蛋白质相互作用网络中蛋白质复合物的识别问题进行了研究。目前蛋
随着科技的飞速发展,人类生活中越来越离不开身份认证和识别。同时人们对个人信息安全的问题也更加的重视,传统的身份认证如密码登陆等已经很难满足人们对个人信息安全的要求。在这种需求不断提升和计算机技术高速发展的背景下,虹膜识别技术凭借着其更高的安全性、准确性、稳定性、防伪性等特点受到了来自学术界和工程界广泛的关注。虹膜识别产品也逐渐应用到与我们息息相关的生活中,如虹膜门禁系统、虹膜签到系统、银行支付系统
因果关系抽取是自然语言处理的一个重要研究方向,现有研究将因果关系抽取转化为关系分类或序列标注任务。文本中的因果关系有丰富的表达形式,对于句中的复杂因果关系和文章级因果关系,现有方法很难有效的抽取。此外,这些研究大多忽视了对因果实体间的语义关联信息的探索。针对上述问题,本文引入语义依存分析和预训练语言模型,结合深度学习的相关算法,提出了两个因果抽取模型,有效的从文本中抽取各类因果关系。具体内容如下:
随着二十一世纪互联网和信息技术的高速发展,技术论坛成为人们获取计算机专业知识的关键平台。人们通过技术论坛发表自己的原创文章,获取自己喜欢的专业领域内容,同时与业界专家互动交流专业领域问题,从而提高自己的专业技能。技术论坛主要发表大量的技术文章或提问,用户通过回帖来表达自己的观点。以往的论坛大多为综合性论坛,其广度的优点不能对每一个专题做到精益求精,提供了大量的内容却未对其进行有效搜索和推荐,导致用
语文学科教学除了要帮助学生掌握语文知识,还要提高学生的道德修养,提升他们的文化品位,使他们形成健全的人格。在高中语文教学中融入传统文化,能够促进教学任务的完成,带给学生更多启迪。本文将针对如何在高中语文教学中融入传统文化展开具体分析,旨在以文化为载体,提高课堂教学质量,营造良好的育人环境。
目的:椎动脉优势(vertebral artery dominance,VAD)是指双侧VA一侧管径较大或双侧管径相等时一侧VA与BA呈直线形连接的血管变异现象。人群中35.5-58%的人为左侧VAD,右侧VAD为19-35.7%[8,9]。现阶段研究认为VAD可能是PCI的危险因素[10]。与前循环缺血相比,后循环缺血患者发现椎动脉管径不对称的发生率更高,并与基底动脉(Basilar Arter
“逆城市化”是城市发展的一个阶段,准确把握中外“逆城市化”的研究热点及演进趋势,对于“十四五”阶段城市提质增效、乡村全面振兴具有重要意义。文章利用CiteSpace可视化分析软件,对1980-2020年的1 112篇中外文献进行了定量分析。研究结果表明,国外的“逆城市化”多为“单轨”运行制,而中国则为“双轨”并行制。从研究热点来看,国内对“逆城市化”的研究主要围绕城市发展阶段、人口流动、现象的总结
以社交网络为代表的大规模信息网络层出不穷,如何充分利用这些信息挖掘出适应于各种任务的通用表示显得尤为重要。现实生活中的大规模信息网络往往包含许多复杂的交互关系和语义信息,且具有多源异质性,这给传统的网络表示学习(Network Representation Learning)方法带来了挑战。深度学习的出现给网络表示学习开辟了新道路,极大的促进了网络节点表示学习研究的发展。本文基于图注意力机制和生成