基于语义空间和神经网络的生物医学事件抽取

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:hexinyu2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物医学文献是展示和传播生物医学知识的有效途径,如何从爆炸性增长的文献数据中快速准确且自动地定位人们所需要的信息,成为了各领域精英重点关注的问题之一。而生物医学信息抽取技术的主要目的就是从非结构化的生物学和医学文本数据中自动解锁结构化语义信息。其中,生物医学事件抽取旨在检测细粒度的实体之间的多元语义关系,并将事件的详细信息以结构化形式展示给人们。本文以生物医学事件抽取作为研究的关键问题,将其分为两个子问题进行研究:触发词识别和元素检测。传统的生物医学事件触发词识别方法基于人工设计特征、构建特征向量,所利用的信息有限。因此,为了避免人工设计特征的复杂性,提升系统的泛化能力,本文利用神经网络自动从单词的语义空间中学习候选实例的特征表示,提出两种触发词识别方法。提出基于卷积神经网络的触发词分类方法,利用卷积神经网络对局部特征的学习能力来识别触发词;提出基于双向长短时记忆神经网络和条件随机场的触发词标记方法,利用长短时记忆神经网络对上下文信息的有效融合与学习,并充分发挥条件随机场考虑全局信息的优点,实现事件触发词的标记。使用双向长短时记忆神经网络和Attention机制相结合的方法进行生物医学事件元素检测,抽取上下文特征、距离特征和候选对属性特征,并从构建的语义空间映射词向量获取语义特征,使用双向长短时记忆神经网络对候选对实例特征之间的时序信息进行建模与学习。同时,进一步引入Attention机制来关注候选对实例中的重要特征,赋予它们更大的注意力概率,并根据所学习到的权重值对模型输出向量进行加权求和,作为候选对实例的最终特征向量表示,进行元素类型的识别。本文在MLEE语料集上实验,利用未标注语料构建语义空间并从中抽取单词的语义特征,使用神经网络构建生物医学事件抽取模型。实验结果表明,本文提出的基于语义空间和神经网络的生物医学事件抽取模型是有效的。
其他文献
在全球一体化的大潮下,跨国并购已变成对外投资的最主要形式之一。在以往的跨国并购活动中,我国企业参与不多,经验较少,鲜见比较成功的案例。但从2008年爆发金融危机以后,欧
随着农业现代化与现代农业经营模式的不断发展,农业企业与农村合作社成为现代农业的两支重要力量。如今,政府积极鼓励和扶持农业企业,促进了农村合作社的建立与发展。但是,新
在人类社会发展过程中,历经原始社会、农业社会、工业社会之后,发展到现在的信息社会。在当今的信息化时代,信息流通高度发达,行业内各个企业之间的技术能力越来越相近,产品
最近来随着智能手机以及各种电子产品的普及,人们使用电子产品的频率越来越高,造成近视人数不断增加,日趋低龄化。据光明日报报道,研究表明,中国青少年近视趋于低龄化,全国现
文章仅就属于《国家重点支持高新技术领域》范围内的科技型中小企业从构建知识产权管理体系、建立以项目为核心的研发管理制度、多渠道强化研发投入力度及促进科技成果转化四
为验证"九业"牌秸秆腐熟剂在溧阳地区稻麦(油)轮作及小麦秸秆全量还田条件下的使用效果,特进行了相关试验研究。结果表明,小麦秸秆全量还田时使用秸秆腐熟剂能加速秸秆腐解速
保障房作为我国的一项民生工程,保障房的建设具有设计简单、户型比较固定、建筑面积适中的特点,因此保障房实施建筑工业化是十分适合的。但是我国的建筑工业化发展较慢,水平
知识产权反垄断执法是相关反垄断部门执法中的弱项。一方面,知识产权法本身允许专利持有人可以在专利有效期内制定垄断高价来激励各厂商的研发投入。另一方面,知识产权领域内
对检察法律文书进行公开,不仅能够深化检务公开,而且能够更好地保障人民群众对检察活动的知情权和监督权,加强检察人员执法办案透明性,使得执法人员办案行为规范化,最大限度