论文部分内容阅读
如今人工智能发展火热,其中智能司法是人工智能的重要应用领域。一方面,深度学习领域的迅速发展为智能司法研究提供了技术支持。另一方面,大量公开的裁判文书解决了智能司法研究的大数据需求。在智能司法建设中,利用人工智能实现罪名预测和相关法条预测,可以辅助法官进行判决并且节省大量资源,对于智能司法建设有着重大意义。本文通过解决罪名和相关法条多标签文本分类任务,进而实现罪名和相关法条预测。本文使用CAIL2018-Small数据集,针对单人多罪名多法条的刑事案件展开研究。数据集中的数据均来源于“中国裁判文书网”上的公开刑事案件裁判文书。数据集的所有数据均只有一个罪犯。数据集共包括202项罪名、183则法条,一条数据可能包含多项罪名和多则法条。本文利用微平均F1值(F1micro)和宏平均F1值(F1macro)作为评价指标。本文使用F1micro和F1macro平均值的100倍作为每项任务的score。本文的主要研究工作如下:(1)对比了三种平均词向量模型,包括平均word2vec词向量模型、平均BERT词向量模型、平均BERT-word2vec词向量模型。相较于两种单一词向量模型,融合不同词向量特征的平均BERT-word2vec词向量模型在罪名和相关法条多标签文本分类任务中都有更高的score。(2)在多核CNN模型中加入不同层次的Attention机制,并融合BERT句向量特征,提出了BERT-ACNN模型。相较于三种平均词向量模型、四种RNN模型以及CNN模型,BERT-ACNN模型在罪名和相关法条多标签文本分类任务中都得到了最高的score。最后本文利用过采样和增加卷积层数的方法来提升BERT-ACNN模型的性能。