基于细粒度词表示的命名实体识别研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lgb0532
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别(NER)是自然语言处理中的一项基础任务,其性能的优劣极大地影响着关系抽取、语义角色标注等后续任务。传统的统计模型特征设计难度大、领域适应性差,一些神经网络模型则忽略了词本身所具有的形态学信息。针对上述问题,该文构建了一种基于细粒度词表示的端到端模型(Finger-BiLSTM-CRF)来进行命名实体识别任务。该文首先提出一种基于注意力机制的字符级词表示模型Finger来融合形态学信息和单词的字符信息,然后将Finger与BiLSTM-CRF模型联合进行实体识别,最终该方法以端到端、无任何特征
其他文献
CE标志:欧洲共同市场安全标志,是一种宣称产品符合欧盟相关指令的标识。使用CE标志是欧盟成员对销售产品的强制性要求。目前欧盟已颁布12类产品指令,主要有:玩具、低压电器、医疗
质量监督是实验室保持人员能力,进行自我完善,日常渐进的重要手段,是持续改进的重要组成部分,也是实验室管理工作的难点,本文给出质量监督的目的、对象、方法、记录等。
以季国标副部长为团长的中国纺织代表团访问苏联期间,参观了苏联醋酸纤维生产厂以及和苏联化工部同志座谈了解到苏联目前醋酸纤维的情况.苏联现有九个醋酸纤维生产厂,其中四
词向量能够以向量的形式表示词的意义,近来许多自然语言处理应用中已经融入词向量,将其作为额外特征或者直接输入以提升系统性能。然而,目前的词向量训练模型大多基于浅层的
当前已经进入以互联网和大数据为主要标志的海量信息时代。计算机和互联网技术的快速发展对中文信息处理技术提出了许多新的挑战。继2010、2012、2014年学会战略研讨会之后,2
识别和定位特定领域双语网站,是基于Web自动构建特定领域双语语料库的关键。然而,特定领域双语网站之间的句对质量往往差异较大。相对于原有基于句对文本特征识别过滤质量较
如何在设计无线电收发器时减少额外的信号辐射?本文重点介绍了包括使用PCB叠层结构、两个地平台层之间走微带线、传导屏蔽盒、过孔屏蔽围栏等适当结构屏蔽等技术在内的PCB布板
针对现有五元组比较句语义要素框架的缺陷,本文引进了提升语义分辨率的七元组语义要素分类模板.在此基础上建立了一个可视化的“比”字句结构分析模型,用以总结出比较对象之
10月28日上午,吴文英部长会见了孟加拉政府贸易代表团团长,中孟联委会孟方主席、孟加拉国计划部外资总局秘书(副部长级)依纳姆·A·乔杜里先生和孟加拉驻华大使法鲁
结合多年教学经验,分析目前大学英语教学中的教育观念、教学方法和教学评价等方面存在的几个误区,并试着给出相关的尝试对策。通过不断的改进创新,摸索新的英语课堂教学模式,