基于强化学习的生物医学实体识别研究与应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:huangmajun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物医学文献的数量浩如烟海,能够挖掘出有价值的生物医学信息具有重要的意义。生物医学实体识别工作是从非结构化的文本中识别出相关的生物医学实体,是进行生物医学关系抽取和构建生物医学知识图谱的重要前提。现阶段的研究方法大多是基于深度学习的,这些方法仍存在很多不足之处,例如容易出现过拟合的问题,并且数据分布不平衡的问题一直没有得到很好的解决。本文提出了一种基于强化学习的生物医学实体识别算法,在传统的基于深度学习方法的基础上,用双向长短记忆神经网络学习单词的上下文语义信息,并将其输出的隐含层状态作为强化学习的输入,利用深度Q学习算法来产生序列的标注,完成标签解码工作。相较于传统的利用前馈型神经网络和条件随机场解码,强化学习模型的解码方法更能学习到长距离的特征。并且通过设置合适的奖励机制,可以有效地避免在监督学习中因为数据噪声或者样本不平衡所带来的干扰。最后通过实验证明了在生物医学实体识别工作上,基于强化学习的方法在性能方面具有明显的优势。本文也将理论与实际相结合,应用生物医学实体识别算法模型,开发了疾病知识提取系统。用户通过系统界面可以查看与神经退行性疾病相关的化合物、致病基因、疾病症状、肽、天然产物等生物医学实体,由此为医学领域研究者提供一个知识图谱可视化系统,通过构建关系网络的方法辅助医学专家对相关疾病进行研究。
其他文献
第五代移动通信技术(the 5th Generation mobile communication technology,5G),是继前四代通信技术后又发展的全新移动通信技术。密集异构蜂窝网络(Dense Heterogeneous Cel
随着信息技术的迅速发展,传统通信系统中依靠波长、偏振、相位等调制以及复用的技术已经无法满足人们对大容量、高速率的通信要求。理论上来讲,利用涡旋光束的轨道角动量(Orb
囿于反垄断立法的模糊性,转售价格维持的适用在实践中首先遭遇了挑战,执法机关和司法机关在对于转售价格维持的规制原则和手段上存在分野。通过对我国执法和司法案例的分析发
如今音乐教育发展的国际化趋势越来越明显,而校企合作办学作为音乐教育进程的一段跃进式历程,在我国音乐教育发展中起着不可或缺的作用。校企合作办学是引进国内外先进企业的
基于频率分集阵列(Frequency Diverse Arrayt,FDA)体制的多输入输出(Multiple Input Multiple Output,MIMO)雷达技术解决了高速运动平台雷达空时自适应处理的距离模糊问题。
全彩色3D打印物体,其颜色与亮度是3D物体表面颜色感知的重要组成部分,颜色感知的准确性、快捷性直接影响物体整体形貌的视觉感知。其中亮度信息既可以影响物体表面整体形貌感
产品装配是智能制造的核心工序。中国在3C,汽车等产业中已经有许多自动化装配生产线,但是有许多行业的装配还处于人工装配阶段,而人工装配具有效率低,装配质量不稳定等问题,
随着智慧城市的建设和无人机技术的发展,利用无人机视频监控系统追踪目标已经成为研究热点。但是同时处理多个摄像机的视频数据,需要大量的计算资源,而且视频监控系统网络边
食品安全已经是社会普遍关注的热点,也与人类生存与健康密切联系。化学因素是食品安全至关重要的因素,高中化学教材中包含大量食品安全的素材,而通过高中化学教学培养学生食
依法治国已经成为我国新时期重要的治国理政方式,国家对于法治建设的重视程度也越来越高。党的十八届四中全会指出,我国应当使致力于强化全民的法治观念,加强对于国民的法治