生物医学事件抽取系统的设计与实现

被引量 : 0次 | 上传用户:getu0217
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,生物医学文献数量与日俱增,如何能从这些无结构化信息中自动的抽取文本信息,将其组织成为便于分析管理的有结构化信息,成为生物信息学领域的研究热点。信息抽取技术在近年来不断发展,随着基于机器学习的方法逐步取代基于规则的方法成为信息抽取的主流,信息抽取的精度不断提高,研究的前沿也从传统的命名实体识别、实体名标准化、关系抽取,向较高层次的生物医学事件抽取演变。生物医学的事件是发生于分子范畴的,各种生物医学实体之间所发生的关系及变化。生物医学事件抽取相较命名实体识别、关系抽取层次更高,从而系统的处理流程也更长。然而在国内研究领域却鲜有适应了这一研究方向以及方法变化的软件工具。本文介绍了生物医学事件抽取系统的发展现状、处理流程及开发过程,基于具有较高扩展性的脚本语言Ruby和“键-值”结构的非关系数据库Redis,使用支持向量机模型,实现了一套针对生物医学文献事件抽取的解决方案。在事件抽取的流程上,采用比较典型的处理流程,主要进行以下三个步骤:预处理,触发词特征及事件元素特征提取,触发词检测及事件元素检测。其中本文把系统设计开发的重点放在了可用性,尤其是采用本文描述的系统进行实验研究时的效率上。通过使用Ruby的元编程能力和Redis的缓存功能,相比同类的事件抽取系统,本文中的系统在词特征的选取上更加易于扩展,在特征和语料发生部分修改时,通过制定的缓存更新规则,能够针对改变部分进行处理,不必重新进行整个事件抽取流程,可以更快的完成需要频繁调优的事件抽取实验,从而更加适合应用于生物医学事件抽取的研究工作。本文在BioNLP2009语料集上进行事件抽取对比实验,实验结果证明本文描述的系统在取得与对照系统相近效果的情况下,更快的完成了抽取,提高了抽取效率。
其他文献
目的分析子宫输卵管造影时出现造影剂逆流的原因探析及处理对策。方法随机选取该院子宫输卵管造影检查患者100例,收治时间在2015年2月—2016年7月期间,按照其是否发生造影剂
高校是意识形态的前沿阵地,大学生是历史虚无主义思潮进行渗透分化的重点人群。历史虚无主义思潮是一种借以歪曲或否定中国近代历史和中国共产党史的方式,意图否定中国马克思
密码设备管理平台,能够对各种密码设备进行集中管理,而各个密码设备之间的消息交互必须安全,基于因特网密钥交换(IKEv2)协议的密钥交换系统,旨在为密码设备管理平台提供密钥
目的分析颈项透明层(nuchaltranslucency,NT)与颈后皮肤皱褶(nuchalfold,NF)在胎儿染色体异常检测中的应用价值。方法选取2015年1月至2016年12月本院经产科超声检查提示为NT
P2P借贷是pccr to poor lending的缩写,最近这些年,在全球化的背景下,基于互联网的一些新的金融产品进入了中国的经济市场。第一家P2P网络信贷平台于2005年在英国开始上线之
全国统一电力市场技术支撑平台系统的研究与开发由于目前社会节奏越来越快,对于信息的实时性和准确性有了更高的要求,因此在当代的各行各业中信息技术与互联网的应用越来越受到
战略大师安索夫在20世纪50年代提出多元化概念后,国际学术界纷纷对其产生广泛关注。很多公司在其经营和发展过程之中都会选择实施多元化战略,但关于多元化战略对公司绩效的影
价值观作为意识形态的核心内容,对社会存在发挥着越来越大的作用,已经成为推动民族和国家走向富强的重要精神动力。社会主义核心价值观作为社会主义意识形态的核心内容,对社
农业信息化是发展现代农业,推进农业发展方式转变的重要支撑,是促进农民增收和推进农业产业化经营的重要手段,是破除城乡两极分化,统筹城乡发展的必由之路,农村电子商务是农
在社会和企业得到飞速发展的今天,企业对人才的需要也发生了改变,随着市场和信息技术的发展,企业对人才的招聘方式也随着发生了变化,传统的人力招聘模式已经不能满足当今企业