基于BERT词向量和Attention-CNN的智能司法研究

来源 :大连理工大学 | 被引量 : 9次 | 上传用户：jywaco

【摘要】

：

如今人工智能发展火热,其中智能司法是人工智能的重要应用领域。一方面,深度学习领域的迅速发展为智能司法研究提供了技术支持。另一方面,大量公开的裁判文书解决了智能司法

【作者】

：

杨彬

【出处】

：

大连理工大学

【发表日期】

：

2019年01期

【关键词】

：

智能司法多标签文本分类 BERT词向量 Attention CNN

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

如今人工智能发展火热,其中智能司法是人工智能的重要应用领域。一方面,深度学习领域的迅速发展为智能司法研究提供了技术支持。另一方面,大量公开的裁判文书解决了智能司法研究的大数据需求。在智能司法建设中,利用人工智能实现罪名预测和相关法条预测,可以辅助法官进行判决并且节省大量资源,对于智能司法建设有着重大意义。本文通过解决罪名和相关法条多标签文本分类任务,进而实现罪名和相关法条预测。本文使用CAIL2018-Small数据集,针对单人多罪名多法条的刑事案件展开研究。数据集中的数据均来源于“中国裁判文书网”上的公开刑事案件裁判文书。数据集的所有数据均只有一个罪犯。数据集共包括202项罪名、183则法条,一条数据可能包含多项罪名和多则法条。本文利用微平均F1值(F1micro)和宏平均F1值(F1macro)作为评价指标。本文使用F1micro和F1macro平均值的100倍作为每项任务的score。本文的主要研究工作如下:(1)对比了三种平均词向量模型,包括平均word2vec词向量模型、平均BERT词向量模型、平均BERT-word2vec词向量模型。相较于两种单一词向量模型,融合不同词向量特征的平均BERT-word2vec词向量模型在罪名和相关法条多标签文本分类任务中都有更高的score。(2)在多核CNN模型中加入不同层次的Attention机制,并融合BERT句向量特征,提出了BERT-ACNN模型。相较于三种平均词向量模型、四种RNN模型以及CNN模型,BERT-ACNN模型在罪名和相关法条多标签文本分类任务中都得到了最高的score。最后本文利用过采样和增加卷积层数的方法来提升BERT-ACNN模型的性能。

其他文献

论袁崇焕与东林党的关系

袁崇焕是明代抵抗后金(即后来的满洲)内侵的民族英雄,他的爱国主义精神和军事才能是值得人们称道的。袁崇焕生平的政治活动和明末的党争有紧密的联系。本文的主要内容,就是

期刊

明思宗东林党

风味竹筒饭

竹筒是天然而理想的保健容器,广泛用于人们的生活中。风味竹筒饭是用竹筒装入糯米和适当品种的调料,经蒸煮加热制作而成。它融合了竹子特有的清香,取食方便,是独具风味的特

期刊

竹筒饭

系统工程思想史的演进与系统工程的发展

本文对系统思想的启蒙、发展、成熟,到系统思想的实践,以及在实践中形成并产生的系统工程和系统工程方法论的发展,作了粗略的总结、归纳和分析。首先分析了古代和近代系统、

会议

系统思想系统论系统工程系统工程方法

五大病因致中药市场乱象丛生

国家食品药品监督管理总局日前约谈全国17个中药材市场的负责人，目的在于打击中药材产品伪劣问题。中药材混乱问题长期以来困扰市场良性发展，其根源到底在哪里？如何才能扼住市场

报纸

脑胚胎癌1例

患儿女性 ,4岁。左下肢跛行半年。头颅ＣＴ及ＭＲＩ示 :右侧颞顶枕叶高密度影像 ,与侧脑室关系密切。临床诊断 :巨大占位性病变或脉络丛乳头状瘤。术中见肿物位于右侧颞顶枕部皮质下 1ｃｍ

期刊

胚胎癌颅内生殖细胞肿瘤

《医学动物实验技术》

<正>本书由国家科学技术学术著作出版基金资助、人民卫生出版社出版,为技术类工具书。内容分为十二篇:动物实验室设计及设备配置;动物实验室认证与规范运行;动物实验基本技术

期刊

医学动物实验动物实验室《医学动物实验技术》

番茄PIN基因家族的全基因组分析及抗逆相关基因筛选鉴定

番茄原产于南美洲、波利维亚、厄瓜多尔等地。16世纪开始做观赏栽培,从20世纪20年代初开始作为我国蔬菜栽培,到20世纪20年代现已成为我国主要的蔬菜。番茄具有栽培方式容易多

学位

番茄生物信息学PIN基因非生物胁迫VIGS技术

浅析肖邦《E大调第四谐谑曲》力度与速度处理

在古典主义时期,谐谑曲仅是海顿、贝多芬奏鸣曲创作中的一个乐章。到了浪漫主义时期,肖邦赋予了谐谑曲全新的精神内涵和体裁形式。肖邦创造性地扩充了谐谑曲的形式结构,将谐

学位

肖邦谐谑曲力度速度演奏处理

春秋青铜水器鉴赏

<正>凡是参观过安徽博物院青铜馆的人,大都会留下这样一种深刻的印象:这里是"青铜宝库,艺术殿堂"。是的,展现在人们面前的数百件青铜文物,器类繁多,造型奇特,工艺精湛,纹饰华

期刊

窃曲纹春秋时期鱼龙纹盘

基于BERT词向量和Attention-CNN的智能司法研究

与本文相关的学术论文