Named Entity Recognition with Gated Convolutional Neural Networks

来源 :第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 | 被引量 : 0次 | 上传用户:dsfsfsg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  Most state-of-the-art models for named entity recognition(NER)rely on recurrent neural networks(RNNs),in particular long short-term memory(LSTM).Those models learn local and global fea-tures automatically by RNNs so that hand-craft features can be dis-carded,totally or partly.Recently,convolutional neural networks(CNNs)have achieved great success on computer vision.However,for NER prob-lems,they are not well studied.In this work,we propose a novel archi-tecture for NER problems based on GCNN — CNN with gating mech-anism.Compared with RNN based NER models,our proposed model has a remarkable advantage on training efficiency.We evaluate the pro-posed model on three data sets in two significantly different languages—SIGHAN bakeoff 2006 MSRA portion for simplified Chinese NER and CityU portion for traditional Chinese NER,CoNLL 2003 shared task English portion for English NER.Our model obtains state-of-the-art performance on these three data sets.
其他文献
该文介绍了维吾尔语形态分析语料库及其构建过程.从网上搜集了新闻、科技、小说、散文、日常用语和其它等不同领域的语料,采用制定切分规则(带语音变化和不带语音变化)、人工切分、错误分析和校对等过程建立了维吾尔语形态分析语料库.该语料库为50万词次规模,分为词级和句子级两类标注.该文工作不仅对相关维吾尔语语料库的建设具有参考意义,而且为维吾尔语的自然语言处理的研究提供了有益的资源.
机器理解词主要借助于词典,但目前的词典释义还不准确,也不完备.对于这些问题,通过分析词的语义结构、建构词的释义模版来解决.通过分析词的语义结构,弄清词义中包含着哪些语义成分、语义关系,确定哪些是必有成分、必有关系,哪些是可有成分、可有关系.然后,结合实例讨论释义模版的建构过程、原则与方法.最后,通过释义模版,解决词典释义不完备、语义联系不明显(以多义词为例)、循环释义(以同义词为例)、新词释义(以
近年来,人工智能技术飞速发展,不少工作试图从人类的认知发展过程中探索前进方向,语言学习认知的过程成为了重点关注的研究领域.已有的语言认知研究工作主要集中在学龄前儿童母语的词汇学习认知方面,依赖于WordBank1等大规模语料库.然而就所知,目前在第二语言学习方面研究不多,尚未有大规模的第二语言词汇学习数据,且传统的数据收集方法难以收集到大规模数据,这也一定程度上限制了对于第二语言学习的研究工作及母
文本情绪原因识别作为一个新型的研究方向在文本情绪分析领域占据重要地位.本文结合卷积神经网络,提出了一种基于集成卷积神经网络的情绪原因识别方法.该方法通过词向量、卷积、池化等操作充分融合了句子的语义信息,利用多个CNN集成降低数据不平衡性对情绪原因识别的影响,克服了传统情绪原因识别方法的繁琐规则制定、特征抽取、特征空间降维等过程.实验结果表明,本文的方法在情绪原因识别方面取得了较好的效果,对于情绪归
标注《文心雕龙》的篇章结构,据此研究其连接词的显隐、语义及用法.研究发现:1)隐式关系(78.1%)多于显式关系(21.9%),17类关系仅有4类(因果、转折、假设、目的)显多隐少;2)各类关系的同义连接词种数与使用有差异,其中种数最多17(顺承),最少则无(总分、背景);3)连接词(56种)单义为多(44),多义为少(12),义项最多为5,分布有差异.最后,个案分析同义连接词与多义连接词的用法,
To discover semantically coherent topics from topic models,knowledge-based topic models have been proposed to incorporate prior knowledge into topic models.Moreover,some researchers propose life-long
Local community detection is an important research focus in social network analysis.Most existing methods share the intrinsic limitation of utiliz-ing undirected and unweighted networks.In this paper,
随着互联网的发展及硬件的更新,神经网络模型被广泛应用于自然语言处理、图像识别等领域.目前,结合传统自然语言处理方法和神经网络模型正日益成为研究的热点.引入先验知识代表了传统方法的惯例,然而它们对基于神经网络模型的自然语言处理任务的影响尚不清楚.鉴于此,本文尝试探究语言层先验知识对基于神经网络模型的若干自然语言处理任务的影响.根据不同任务的特点,比较了不同先验知识和不同输入位置对不同神经网络模型的影
We take the generation of Chinese classical poetry as a sequence-to-sequence learning problem,and investigate the suitability of recurrent neural network(RNN)for poetry generation task by various qual
Understanding chemical-disease relations(CDR)from biomedicalliterature is important for biomedical research and chemical discovery.This pa-per uses a k-max pooling convolutional neural network(CNN)to