生物医学实体关系抽取研究

来源 :大连理工大学 | 被引量 : 9次 | 上传用户:niudaben
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物医学文献是学术成果展示和学术交流最主要的方式。目前,海量的生物医学文献已经成为一座巨大的知识宝库,是最重要的生物医学领域资源。生物医学实体关系抽取是将自然语言处理、机器学习、深度学习等技术应用于生物医学文献,高效、准确地抽取出生物医学实体(基因、疾病、药物等等)之间存在的某种关联。生物医学实体关系抽取及其相关研究能够辅助生物医学研究者的研究工作,对于生命科学各领域的研究具有广泛的应用价值。此外,生物医学实体识别作为生物医学实体关系抽取的基础,直接影响后续关系抽取工作。本文对生物医学实体识别、生物医学实体间关系抽取和生物医学实体关系三元组抽取进行了相关研究,主要研究内容包括如下三个方面:对于生物医学实体识别,提出了多标签卷积神经网络(Multiple Label Convolutional Neural Network,ML-CNN)方法。该方法把命名实体识别任务抽象成词级别的分类问题,将要预测的词和该词周围若干词作为输入,并提出了适合词级别分类框架的多标签机制,获取相邻输出标签之间的依赖关系,简化了主流的深度学习方法获取标签之间依赖关系过程。与经典的条件随机场方法相比,ML-CNN方法几乎不需要特征工程,具有较强的泛化能力。该方法在疾病名识别(NCBI和CDR语料)和化学物名识别(CHEMDNER语料)上取得了较好的性能。对于生物医学实体关系抽取,提出了句法卷积神经网络(Syntax Convolutional Neural Network,SCNN)模型。该方法通过利用句法结构上下文信息训练词向量,将句法信息引入到模型中,得到了包含句法信息的样本表示。此外,SCNN方法先利用Auto-encoder对One-hot形式特征向量进行编码得到对应的分布式表示形式,然后再与其它分布式特征融合,使两种形式特征更好地融合在一起。SCNN方法在DDIExtraction2013评测语料上进行实验,取得了较好的性能。对于生物医学实体关系三元组抽取问题,提出了一种混合的关系三元组抽取方法。该方法将关系三元组抽取分成三个步骤:(1)利用ML-CNN方从生物医学文献中识别出生物医学实体。(2)对于识别出的生物医学实体,利用SCNN方法抽取出存在某种关系的实体对。(3)结合句法模板和词典匹配方法找出表示两个实体间关系类型的关系词,形成实体关系三元组——(实体1,关系词,实体2)。当前主流的关系三元组抽取方法都是基于规则的方法,而基于规则的方法召回率普遍较低。该方法通过有效地结合机器学习方法和规则方法,提升了关系三元组抽取的召回率,在关系类型比较丰富的蛋白质-蛋白质交互关系抽取语料(AImed)上进行实验,取得了较好的性能。
其他文献
利用先进的集成技术整合与集成计算机系统,实现信息资源的优化配置和充分挖掘信息的潜在价值,是企业必然面临和亟待解决的问题。为满足乌江公司信息化的总体要求,推动集控核心业
当前,督查检查考核存在名目繁多、频次过高,过分注重纪实留痕,考核评价不够科学合理,对基层的实情体察不深等诸多偏差。其主要原因在于工作惯性依赖,形式主义、官僚主义弊病
“平衡能力”是一切身体活动的基础,而前庭平衡障碍是聋哑症患者最常见病症之一,其因前庭器官受到破坏,致使平衡能力、神经和肌肉活动的灵活性、协调性较正常人相比甚远,因此
电气照明技术作为建筑电气与智能化专业的重要必修课之一,传统教学模式已经无法适应当前教育教学的需求。为提升学生工程专业知识与实践能力,为建筑电气于智能化专业后续课程
通过地表调查、点荷载试验、声波测试、结构面网络模拟(Monte-Carlo)等综合手段,对鱼简河水库RCC抛物线双曲拱坝坝址坝基岩体进行分类和评价,提出了本工程大坝建基面可以抬高2m的
提出了一种模糊遗传算法(FGA),对交叉率和变异率进行模糊控制,有效地提高了收敛速度,避免了不成熟收敛。将FGA用到配电网络重构中,取得了较好效果。另外本文提出用支路的开关
深入学习领会、认真贯彻落实云南省第十次党代会精神,大理白族自治州要加强以洱海为重点的环境保护与治理,集中力量决胜脱贫攻坚,加快推进产业发展和"五网"基础设施建设,着力
思林水电站溢流坝表孔弧形闸门及启闭机液压缸的吊装采用公路架桥机吊装的方式,即充分利用公路架桥机吊装稳定、移动准确和单钩可独立操作的优点。采用该吊装工艺可以大大节
中国高等教育经过20世纪的规模发展,进入21世纪必须以教学质量发展为主题,以教学质量提高作为首要目标。审核评估作为高等教育评估制度之一,为健全高校教学质量监控体系开拓
三板溪水电站在一个枯水期内完成大江截流、围堰闭气、坝基开挖、趾板浇筑,并将坝体填筑到100年一遇拦洪度汛高程,提前17d实现"一枯抢拦洪"目标.本文主要介绍为实现"一枯抢拦