论文部分内容阅读
命名实体识别是指识别文本中具有特定意义的实体,如人名、地名、机构名、专有名词等。命名实体识别是信息提取、问答系统、句法分析、机器翻译等领域的重要基础任务。现有的模型通常需要在大量标记良好的语料库上进行学习训练,然而,实际生活中往往很难获得足够的标注数据来训练模型。为了让模型在有限的数据集上获取充分的上下文信息,提出一种基于确定性自动编码器的模型架构,利用语言模型来充分捕获文本序列中的潜在语义信息。实验结果表明,该方法在微软亚洲研究院和中文医疗文本命名实体识别数据集上都表现出良好的性能,F1值分别达到了90