基于BERT的民事纠纷问答模型研究

来源 :上海海洋大学 | 被引量 : 0次 | 上传用户:qyxiao3771
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和社会经济的迅速发展,人们面临的法律问题越来越多样化、复杂化,因此法律咨询业务的推进对社会的发展而言,有着非常重要的价值。然而,律师相关的咨询业务在现实开展过程中还是面临各种各样的窘境,比如:发展速度慢,律师咨询业务创收较低,聘请率低下,律师业务水平不足等诸多问题。因此,借助大数据和深度学习的方法,建立自动化民事纠纷问答模型具有较高的学术价值与应用价值。民事纠纷问答面临的难点为专业领域性强、数据繁杂不一。现实生活中的民事纠纷往往具有多样性,大多数问句存在着长短不一、特征分散、种类繁多的难点,使得机器模型难以理解问题的意图类别。当前的法律问答系统多采用的简单深度模型,忽视了生活中的常识知识。因此,本文结合预训练模型BERT,对民事纠纷问答进行研究,主要研究成果包括:(1)构建了面向民事纠纷的问答数据集。采用爬虫技术从专业的法律咨询网站获得了民事纠纷的问题和答案来构建问答数据集。(2)提出了结合BERT与多尺度CNN的民事纠纷问句意图分类模型。该模型采用BERT对问句进行语义编码和语义补充,设计多尺度卷积层Text Inception进行特征提取,将不同尺度的问句特征进行拼接,输入到分类层对问句进行分类。实验结果表明,该模型在中文民事纠纷问句数据集上取得了较好的结果。(3)提出了融合BERT与案件问题多头自注意力的民事问答模型。该模型采用BERT对法律案例和问题进行编码,并融合问句的多头自注意力表示,来关注问句的重点信息。通过双向GRU学习上下文的语义信息,将得到的特征向量输入到分类层进行预测答案。实验结果表明,该模型能够有效提升问题答案的准确率和F1值。(4)提出了结合BERT与CBAM的民事纠纷答案选择模型。该模型采用BERT表示民事纠纷的问题和答案的语义特征,设计多通道注意力卷积层来进一步提取局部特征信息和重点信息,输入到分类层进行预测正确的答案。实验结果表明,该模型能够有效提升答案选择的MAP和MRR值。
其他文献
近年来,暗纹东方鲀养殖效益欠佳,造成养殖户的积极性降低,亟需进一步丰富市场上暗纹东方鲀的养殖品种。然而,暗纹东方鲀的人工繁殖和杂交育种效率低下,通过人工方式对胚胎质量及胚胎发育的各个时期进行分类检测准确性不高。利用图像处理技术精确的识别分类出暗纹东方鲀胚胎的各个时期,并通过分析每个时期的特征建立合适的盐度、温度等养殖环境,可以提高人工繁殖和杂交育种的成活率,采用自动方式并提高暗纹东方鲀胚胎各个时期
学位
近年来,由于我国国民经济的快速增长、电商行业的兴起以及物流速递等业务的蓬勃发展,中华绒螯蟹作为我国特色水产经济作物之一,已经拥有相当规模的销售市场。但是,目前市场上主流的大闸蟹追溯方式是采用捆扎条形码或二维码等电子标签于蟹钳上,由于标识物的可替换性,单单依靠这种方式追溯河蟹信息并不可靠。因为大闸蟹生长环境的变化,个体大闸蟹背甲图像中的隆起、凹陷、沟渠、纹理等形态性状会出现较为明显的差异,因此个体河
学位
随着人们对于水产品需求的不断增加,根据国际粮食和农业组织估计,到2030年全球水产品需求缺口预计将达到3000万吨。海洋渔业农牧化也是我国现代海洋渔业发展的趋势,渔业的发展对于我国人民群众的生活和国民经济有着十分重要的意义。在水产养殖中,最重要的问题之一是通过自动化手段准确地、持续地监测鱼的各类形态特征,来评估鱼类健康状况并优化鱼群日常饲养流程,为确定最佳的捕捞时间提供科学指导。鱼类的体尺参数是评
学位
GDP(二磷酸鸟苷)和GTP(三磷酸鸟苷)是核苷酸的一种,参与了生物中大部分生物化学反应,在DNA复制与转录、跨膜运输、肌肉收缩以及多种代谢过程中都发挥着不可替代的作用。在大多数生物细胞活动中,都需要蛋白质与核苷酸互相结合来发挥其作用。蛋白质-核苷酸结合位点的识别不仅有助于探索分子间相互作用的机制,而且有助于有效地解释疾病的发病机制,为药物的发现和设计提供帮助。传统的研究通常是使用生物学实验预测蛋
学位
腹泻是影响畜禽发育和生长的多发病,它制约着养殖业的发展。我国的中药资源非常丰富,在抗病原微生物的同时,又能改善肠道菌群,并且提高机体免疫力,在畜禽腹泻的防治上具有独特的优势。该文在分析畜禽腹泻病因的基础上,针对细菌性腹泻、病毒性性腹泻、寄生虫性腹泻以及非感染性腹泻等不同情况常使用的抗腹泻中药,结合防治机制对中药防治畜禽腹泻的研究现状进行了全面的阐述,以期为后期的研发提供理论依据。
期刊
<正>在新课标的背景下,小学英语教师就要注重提高教学效果,改善作业质量,减轻学生在英语学习中的压力,对课堂教学内容进行深入的研究,掌握学生的真正学习状态,开展小学英语单元整体作业设计,促进发展学生的核心素养。优化评价方式,才能将学生的小学英语学习效果提升上来。在开展教学的过程中,
期刊
<正>我国的能源结构丰富而复杂,其中电力能源为重要的组成部分之一,多年来一直持续不断地支持着我国的现代化建设。但随着我国经济的飞速发展,电力能源有限性和不可再生性的弊端开始显露,我国的生态环境保护也在发展中受到了阻碍。于是新时期以来我国党和政府大力推行可持续发展战略,号召各大企业节能减排,合理规划能源资源利用,同时大力扶持新能源的开发和推广,
期刊
海面温度(Sea Surface Temperature,SST)与全球气候变化、海洋灾害、海洋生态系统密切相关,因此准确的预测海面温度是一个具有重要意义的课题。随着海洋监测技术的不断进步,海面温度等海洋环境要素数据被大量采集,数据驱动的海面温度时间序列预测方法逐渐显现出了其良好的效果。但现有的数据驱动方法忽略了海面温度与气温、风速等其它海洋环境要素之间的关联关系,限制了精度的提高。为了有效捕获不
学位
在生物学研究领域,高通量测序技术催生了海量的生物学数据。从这些生物学数据出发,利用合适的生物信息学方法发掘与疾病发生机制相关的生物通路,研究疾病与生物通路间的关系,对疾病的诊断和治疗技术的发展具有重要的意义。从高通量的海量数据中获得对疾病深层次的认识,发现疾病的复杂机制依然是研究人员面临的一个挑战。虽然在过去的十几年,相关研究人员已经开发出一些基因富集分析方法来发现与疾病相关的生物通路。然而这些方
学位
车辆分群调度问题是计算机科学和运筹学中一类重要的组合优化问题,其在现实生活中具有广泛应用,如磁盘碎片整理、程序重构、细胞检测、集成电路测试、考试时间表安排等等。因此,对其进行研究具有重要的理论与实际价值。本文主要研究几个特殊网络上单台车辆分群调度问题。给定一个网络图,若干个待服务的客户分布在该网络上,并且这些客户被划分为若干个子集,每个子集称为一个群。给定一台车辆,其需要服务所有客户,且每个群内的
学位