基于双向LSTM和两阶段方法的触发词识别

来源 :第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 | 被引量 : 0次 | 上传用户:czw6243579
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物事件抽取是生物文本挖掘领域的一个重要分支,而触发词识别作为事件抽取的重要子过程,已经吸引了众多的关注.现有的触发词识别方法多为浅层的一阶段方法,训练代价较大,且需要丰富的领域知识抽取大量特征,人工成本较高.因此,本文提出了一种基于两阶段和双向LSTM神经网络的触发词识别方法.首先,将触发词识别分为识别和分类两个阶段,有效的缓解了训练过程中存在的类不平衡问题.其次,在两个阶段中均采用目前性能较好的双向LSTM神经网络来完成二分类任务和多分类任务,避免了浅层机器学习方法抽取人工特征时的代价.此外,利用PubMed数据库下载大规模语料训练带有依存关系的词向量,获得了更加丰富的语义信息,从而有效的提高了触发词的识别性能.本文方法在生物事件抽取通用语料MLEE上已获得目前最好抽取性能,F值为78.46%.
其他文献
明代广东瓷业有了空前的发展,流行龙窑和馒头窑,是广东历史上又一个陶瓷飞跃发展的阶段。此时期梅州各地窑口大规模烧制日用瓷和外销青花瓷。其中仿龙泉青瓷范围最广,窑址分布在
古龙高1956年7月出生,江苏连云港人,经济学学士,哲学硕士。现任江苏省社科院连云港分院(连云港市社会科学院)党组成员、副院长,研究员。连云港市哲学社会科学界联合会副主席(兼),连云
<正>纤维支气管镜检查是一项内窥镜技术,已成为临床呼吸道疾病诊治过程中不可或缺的检查、治疗方法,可使许多隐藏在气管、支气管及肺内深部难以发现的疾病,在没有体表创伤的
螺旋藻是一种营养价值很高的天然绿色食品。除了含有 6 5 %的植物蛋白和多种微量元素 ,维生素以外 ,还含有 5~ 1 0 %的藻蓝色素。文章介绍由螺旋藻中提取藻蓝色素的研究成果及
基于数字光处理技术(DLP)的光固化3D打印技术是一种面曝光成型技术。面曝光工艺一次成型一个平面,因此对光照均匀度有很高的要求,而传统的DLP面光源很难达到很好的均匀度,严
三峡库区城镇是所辖区域政治、经济和文化中心、也是交通枢纽和物质集散地以及重要文物古迹,风景名胜所在地,城镇搬迁,重建将对区域社会、经济和环境产生广泛而深远的影响。不合
结合世界第一高桥——贵州省毕都高速北盘江特大桥施工关键技术之一塔柱施工测量控制技术的应用,总结了在桥梁高墩、高塔施工中运用现代测量控制技术对高达269 m塔柱的精确控
首先对"任务驱动"教学法的概念和任务驱动教学法在信息技术教学中应用的可行性进行分析,其次根据以上分析设计出一个V B程序设计"任务驱动"教学法的案例,最后根据自身使用"任务驱
当下,国内商旅市场迸发出了巨大潜力,吸引着各路诸侯跑步入场:国外商旅大鳄们纷纷与中国企业合资进入国内市场,国内众多原本经营休闲旅游的旅行社也相继组建商旅服务部门,很
随着我国高速公路的迅猛发展,公路质量是工程的生命已成为人们的普遍共识,而作为检验工程质量的唯一有效手段一试验检测,其重要性不容忽视。本文主要基于试验检测工作的重要性,去