基于BERT词向量和Attention-CNN的智能司法研究

来源 :大连理工大学 | 被引量 : 9次 | 上传用户:jywaco
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今人工智能发展火热,其中智能司法是人工智能的重要应用领域。一方面,深度学习领域的迅速发展为智能司法研究提供了技术支持。另一方面,大量公开的裁判文书解决了智能司法研究的大数据需求。在智能司法建设中,利用人工智能实现罪名预测和相关法条预测,可以辅助法官进行判决并且节省大量资源,对于智能司法建设有着重大意义。本文通过解决罪名和相关法条多标签文本分类任务,进而实现罪名和相关法条预测。本文使用CAIL2018-Small数据集,针对单人多罪名多法条的刑事案件展开研究。数据集中的数据均来源于“中国裁判文书网”上的公开刑事案件裁判文书。数据集的所有数据均只有一个罪犯。数据集共包括202项罪名、183则法条,一条数据可能包含多项罪名和多则法条。本文利用微平均F1值(F1micro)和宏平均F1值(F1macro)作为评价指标。本文使用F1micro和F1macro平均值的100倍作为每项任务的score。本文的主要研究工作如下:(1)对比了三种平均词向量模型,包括平均word2vec词向量模型、平均BERT词向量模型、平均BERT-word2vec词向量模型。相较于两种单一词向量模型,融合不同词向量特征的平均BERT-word2vec词向量模型在罪名和相关法条多标签文本分类任务中都有更高的score。(2)在多核CNN模型中加入不同层次的Attention机制,并融合BERT句向量特征,提出了BERT-ACNN模型。相较于三种平均词向量模型、四种RNN模型以及CNN模型,BERT-ACNN模型在罪名和相关法条多标签文本分类任务中都得到了最高的score。最后本文利用过采样和增加卷积层数的方法来提升BERT-ACNN模型的性能。
其他文献
袁崇焕是明代抵抗后金(即后来的满洲)内侵的民族英雄,他的爱国主义精神和军事才能是值得人们称道的。袁崇焕生平的政治活动和明末的党争有紧密的联系。本文的主要内容,就是
竹筒是天然而理想的保健容器,广泛用于人们的生活中。风味竹筒饭是用竹筒装入糯米和适当品种的调料,经蒸煮加热制作而成。它融合了竹子特有的清香,取食方便,是独具风味的特
期刊
本文对系统思想的启蒙、发展、成熟,到系统思想的实践,以及在实践中形成并产生的系统工程和系统工程方法论的发展,作了粗略的总结、归纳和分析。首先分析了古代和近代系统、
国家食品药品监督管理总局日前约谈全国17个中药材市场的负责人,目的在于打击中药材产品伪劣问题。中药材混乱问题长期以来困扰市场良性发展,其根源到底在哪里?如何才能扼住市场
报纸
患儿女性 ,4岁。左下肢跛行半年。头颅CT及MRI示 :右侧颞顶枕叶高密度影像 ,与侧脑室关系密切。临床诊断 :巨大占位性病变或脉络丛乳头状瘤。术中见肿物位于右侧颞顶枕部皮质下 1cm
<正>本书由国家科学技术学术著作出版基金资助、人民卫生出版社出版,为技术类工具书。内容分为十二篇:动物实验室设计及设备配置;动物实验室认证与规范运行;动物实验基本技术
番茄原产于南美洲、波利维亚、厄瓜多尔等地。16世纪开始做观赏栽培,从20世纪20年代初开始作为我国蔬菜栽培,到20世纪20年代现已成为我国主要的蔬菜。番茄具有栽培方式容易多
在古典主义时期,谐谑曲仅是海顿、贝多芬奏鸣曲创作中的一个乐章。到了浪漫主义时期,肖邦赋予了谐谑曲全新的精神内涵和体裁形式。肖邦创造性地扩充了谐谑曲的形式结构,将谐
<正>凡是参观过安徽博物院青铜馆的人,大都会留下这样一种深刻的印象:这里是"青铜宝库,艺术殿堂"。是的,展现在人们面前的数百件青铜文物,器类繁多,造型奇特,工艺精湛,纹饰华