文本表示及其特征生成对法律判决书中多类型实体识别的影响分析

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:fencer_200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]探索法律判决书中不同模型的实体识别效果,为后面法律知识库的构建做些基础性工作。[方法]提取刑事判决书中的庭审过程和法院意见来构造数据集,比较人工构造特征的CRFs模型和加入预训练词向量做文本表示的自动生成特征的IDCNN-CRFs模型与BiLSTM-CRFs模型的实体识别效果,并在少量其他类型法律判决书文本上比较模型的迁移能力。[结果]实验表明ALBERT-BiLSTM-CRFs模型实体识别效果最好,F1微平均值达95.28%,IDCNN-CRFs模型的识别效果低于前者,但训练时间是前者的1/6,两个模型均具有较好的迁移能力。[局限]识别的实体多为通用实体,后续考虑标注更多领域特有实体,增强研究对实际应用的参考价值。[结论]法律判决书的实体识别中ALBERT-BiLSTM-CRFs和IDCNN-CRFs模型比CRFs模型效果更好且迁移能力更强。
其他文献
淫羊藿是中医用于治疗小儿麻痹症、神经衰弱、慢性支气管炎的中草药。本文通过从大叶淫羊藿中提取甙类化合物投喂荷兰幼体大白鼠,观察并测定其体重、睾丸增长量、副睾中精子密
针对直流系统充电机状态难以评估的问题,文章提出BP神经网络预测方法对充电机状态进行预测,仿真结果表明所设计的BP神经网络方法在584次迭代时收敛,表明所提出方法的有效性。
基于当前钻机模块单独设置电站或者依托组块电站集中供电的方案在部分项目中可靠性与经济性都不佳的现状,文章提出一种海上石油平台组块与钻机模块电力组网的技术方案,将位于
文章通过介绍一起设备异常情况,分析储油柜胶囊破裂后的造成的假油位及危害,总结出日常运维的注意事项,避免油浸式变压器运行中再次出现类似故障。
目的:了解维族、汉族精神分裂症患者入院时病情严重程度是否存在差异:方法:选取2010年1月1日~2010年6月30日在乌鲁木齐市第四人民医院住院的符合CCMD-3诊断为精神分裂症的维族、
尽管已经过去了10年,但我面对党旗庄严宣誓的场景却依然历历在目。10年前,我迈出了人生最重要的一步,光荣地加入了中国共产党。兴奋之余,我也初步认识到作为党员要肩负起更多的责
期刊
近年来,蚜虫、粉虱、螨虫、蓟马等棚室害虫的发生越来越严重,尤其是螨虫、蓟马等肉眼难以见到的害虫,难防难治已成为菜农的共识。目前,秋茬棚室蔬菜已经定植,但不少菜农在蔬菜定植
司法人工智能辅助系统在“智慧法院”建设中占核心地位,应该在兼顾技术边界的同时真正回应司法实践的实质性需求。法定犯裁判事实证成的行政不法前置性、弱评价性及行为不法
谁照亮2006中国经济.谁在影响2006年中国经济走势?谁制造了2006中国经济的亮点?谁是2006中国经济的刀锋人物?
为探究怀山药皮(Chinese yam peel,YP)对淇河鲫免疫的影响,选取平均体重为(106.76±3.74)g的淇河鲫240尾,随机分为对照组(NC)、0.5%怀山药皮添加组(LYP)、1%怀山药皮添加