基于深度学习的化学物蛋白质关系抽取研究与设计

来源 :苏州大学 | 被引量 : 0次 | 上传用户:hansenhuang1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物医学文献数量的迅速增长,如何从浩如烟海的生物医学文献中快速有效地提取有价值的信息和知识,成为当前亟待解决的问题。化学物蛋白质关系抽取(Chemical Protein Relation Extraction,CPRE)是指从生物医学文献中自动抽取出化学物和蛋白质之间的相互作用关系,如激活、抑制、拮抗和催化作用等,它对生物医学知识图谱的构建、精准医学和新药研发等方面具有重要的意义。本文对生物医学领域化学物蛋白质关系抽取的研究主要包括以下内容:(1)提出了基于最短依存路径和集成学习的化学物蛋白质关系抽取。本文提出了一种基于最短依存路径和注意力机制的双向LSTM模型,并将它应用于化学物蛋白质关系抽取。在特征上综合考虑了实体间最短依存路径上的词性、位置和依存关系类型等信息。在BioCreative Ⅵ CHEMPROT任务上的实验表明,本文的方法取得了较好的性能,同时,集成学习方法还可以进一步提高了化学物蛋白质关系抽取性能。(2)比较了基于预训练语言模型的化学物蛋白质关系抽取。鉴于以BERT为代表的预训练模型在自然语言处理领域内取得的进步,本文将BERT、BioBERT和XLNet等当前常用的预训练模型应用到化学物蛋白质关系抽取任务中,并通过实验对这些预训练模型在化学物蛋白质关系抽取任务上的性能进行了比较和分析,研究表明,基于生物医学语料的BioBERT模型在化学物蛋白质关系抽取中取得了最佳性能。(3)设计和实现了一个面向生物医学领域的信息抽取平台BioPIE(Platform for BiomedicalInformation Extraction)。该平台具有通用性和灵活性的特点,可以支持实例级、句子级、摘要级和全文级等不同标注层次的语料库,可以实现多种命名实体识别和关系抽取任务,并且可以通过类的继承和重写来实现复杂的信息抽取任务。
其他文献
多示例学习是机器学习的研究热点之一。为了建立比较准确的分类器,大部分的多示例学习算法要求大量的已标注多示例包。然而,人工标记大量的包,需要耗费巨大的经济成本。因此,
随着工业4.0和中国制造2025的相继提出,智能制造成为工业制造领域的发展方向。近年来,机器视觉技术、模式识别技术、以机器学习为代表的人工智能技术发展迅猛,并且被越来越多
近年来,全球自然灾害频发,灾害的年均发生次数和造成的损失都呈逐年上升趋势。如何搞好灾后重建工作成为世界性热点问题。我国地处环太平洋地震带,为全球最易致灾地区之一,同
超表面具可以实现对光的偏振、相位、振幅、强度的调控等等,因此具有广泛的应用,例如:实现对于光的百分百吸收、调节散射光相位、偏振方向操控、光聚焦、全息成像等等。在表面增强红外吸收领域,因为红外吸收与电场的平方成正比,所以需要借助超表面实现较强的场增强。在折射率传感器领域,需要设计出品质因子较高的传感器,这需要吸收峰的半高宽是极小的,所以需要借助超表面来产生半高宽较小的利用等离激元的器件。以往的光栅往
托尼·莫里森的最新小说《上帝保佑孩子》(2015)以当代美国社会为故事背景,讲述了拥有深黑色皮肤的小女孩布莱德将自我从童年创伤中解放、最终成为成功的职场女性的故事。《上帝保佑孩子》自出版以来赢得了国内外的普遍关注。学者们从不同角度解读该小说,相关研究多侧重于童年创伤、言语的治愈功能、家庭关系、主体构建、爵士乐审美以及种族主义和肤色主义对非裔美国人的影响等,但较少论及小说的文体风格。因此,本文以巴赫
给煤机是火电厂制粉系统中的一个重要组成部分,其运行状态是否良好将会影响整个发电厂的安全及经济效益。经在某电厂调研发现,其使用的传统给煤机监测设备只能采集到给煤机的
2019年末至2020年初,新型冠状病毒引发的肺炎疫情在我国湖北省武汉市爆发。新冠疫情作为一起突发公共卫生事件,将国民关注的健康议题推到了新高度。健康问题关乎每一位国民的生命安全及切身利益,也影响着整个国家的进步与发展。电视媒体作为大众获取健康信息的主要渠道之一,积极承担起传播健康信息的责任,一方面向公众传播健康信息,另一方面对全民健康素养的培养起到了关键的作用。本文首先以纵向视角对我国大部分健康
现代战争中的雷达目标具有高速度,高机动性,低可探测性的特点,给雷达探测技术带来挑战。众所周知,延长雷达目标积累时间可以提高雷达对微弱目标的检测能力。然而,对于高速机
随着时代的发展,地市级博物馆对社会发展的作用日益凸显,其建设也引起了各级党和政府的重视。我国相继建成了一批规模较大、功能较全的博物馆。然而,就现状来看,管理模式的单
甲基营养型芽孢杆菌(Bacillus methylotrophicus)NJ13菌株是一株对人参锈腐病菌(Ilyonectria robusta)具有较好防病效果的生防菌株。本研究开展了NJ13菌株与人参锈腐病菌DQX01的互作研究,确定了抑制锈腐病菌孢子萌发的互作关键时间点,通过转录组测序技术分析了互作过程中的NJ13菌株的基因差异表达变化和基因表达谱,以期了解NJ13中可能参与抑制DQX01孢