论文部分内容阅读
使用BERT预训练模型及神经网络提取公共安全事件命名实体.以中文突发事件语料库(Chinese emergency corpus,CEC)为实验数据集,使用BIO序列标注方法标记该数据集的实体.采用BERT(bidirectional encoder representations from transformers)预训练模型获取单个汉字的词向量,并使用BiLSTM(双向长短期记忆网络)及CRF(条件随机场)的融合模型提取特征,用以识别公共安全事件的时间、地点、参与者及参与者的行为.采用CRF,BiLS