基于生物医学词典的实体表示及其应用研究

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:njcxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和生物技术的高速发展,生物医学文献正以指数方式增长。面对这些海量数据,研究人员迫切希望揭示蕴含于其中的生物医学知识,这一需求推动了生物医学文本挖掘技术的产生与发展。命名实体识别和链接作为其中的一项重要研究,旨在从文本中识别出生物医学实体并将它们映射为唯一的实体标识符。实体识别和链接研究是关系抽取、信息检索、知识库自动填充等任务的首要步骤,具有重要的研究意义。生物医学领域存在丰富的词典资源,能够作为数据驱动方法的补充,建模数据背后隐含的关联逻辑。本文深入探索生物医学词典中的实体名信息、实体描述信息以及实体结构信息的表示方法,重点研究基于实体知识表示的生物医学实体识别和链接任务,主要研究内容如下:研究基于生物医学词典和语言模型相结合的实体识别。分别通过字符匹配和n元匹配算法抽取实体名的词典特征,并映射为低维向量表示。同时,利用语言模型获取上下文特征。探究上述特征表示的组合对实体识别性能的影响。实验表明,词典特征表示有助于生物医学实体的识别,而语言模型的加入能够进一步提高识别的性能。研究基于实体描述文本的实体表示,用于生物医学实体链接。抽取词典中实体的描述文本,基于神经网络学习实体表示。再利用Transformer模型,抽取与实体表示相关的上下文信息,用于实体消歧。实验表明,基于实体描述文本的实体表示有助于实体链接性能的提升。研究基于实体结构信息的实体表示,用于生物医学实体链接。利用词典中的同一实体多种变体和不同实体同名的实体结构知识,基于自动编码机,学习实体表示。再利用Transformer模型,抽取与实体表示相关的上下文信息,用于实体消歧。实验表明,通过自动编码机学习获得的实体表示,嵌入了词典实体间的结构信息,进一步提高了实体链接的性能。本文研究能有效提高生物医学实体识别和链接性能,并且也适用于其他领域的实体识别和链接任务,具有领域普适性。
其他文献
由于β-二亚胺配体和硅胺配体支持的金属化合物能在多种类型的反应中作为很好的小分子前驱体和高效催化剂,科学家们对于该类化合物的研究一直热度不减。本文研究了β-二亚胺
随机数发生器(Random Number Generator,RNG)在现代密码学中处于基础而核心的地位,其生成的随机数为密码算法和安全协议等众多密码应用提供基本安全保障。随着移动互联网、物
泊松代数是同时带有李代数和交换结合代数两种结构的代数,且这两种代数结构之间满足莱布尼兹法则。泊松代数可用一种二元运算来表示,为避免与经典的泊松代数混淆,我们称这种表现形式下的泊松代数为星形式泊松代数。本文主要通过星形式泊松代数来研究泊松代数的双代数理论。我们首先介绍了星形式泊松双代数,其等价于泊松双代数,并且很多泊松双代数的性质可以通过其上的星运算表达出来,包括星形式泊松双代数、星形式泊松代数的相
随着科学技术的不断发展,广播电视传输和发射技术有了长足的进步。而广播电视监测工作是构成广播电视传输和发射技术发展不可或缺的部分,也是广播电视安全播出的重要技术保障
与中高轨卫星相比,低轨卫星网络具有时延短、覆盖范围广和用户终端小型化等长处,被用于多媒体广播、移动通信、远程物联网等多个领域,具有发展前景十分可观。低轨卫星网络中
碳纳米材料一直是近年来研究的热点内容,在气相色谱分离领域也有广泛的应用。石墨相氮化碳(g-C_3N_4)具有类似碳材料的层状堆积结构以及富电子的π共轭结构,同时它具有不同于以往碳材料的富含氮的结构,因而将其用于气相色谱分离与以往碳材料相比可能展现出不同的选择性和保留行为。主要内容如下:1.采用静态法首次将g-C_3N_4制备成气相色谱柱用于气相色谱分离,柱效为3760塔板数/米,麦氏常数表征其为弱
伴随着人工智能的快速发展,自动驾驶技术正从幻想变为现实,其在为我们带来便利的同时,也将给人类驾驶领域的法律规制带来新的挑战。以美国、日本和德国为代表的域外国家为推
近年来,各类新型业务,如自然语言处理、语音识别以及增强现实等的广泛应用对智能终端有限的计算能力和电池蓄电能力提出了严峻的挑战。如何提高智能终端的业务处理能力,改善
基于深度卷积神经网的超分辨重建SR技术取得了出色的性能。不过,SR卷积网对分层特征选择的可解释性还是一个开放性问题;同时,实现特征多样性表达的网络的构造方法也不够明晰
温室效应和全球变暖等环境问题已日益影响我们的日常生活,有效利用CO_2以解决环境和能源问题迫在眉睫。酶催化CO_2还原技术由于其绿色环保并且高效的特点而备受青睐,单酶或多酶体系可以将CO_2转化为甲酸、甲醛和甲醇等有用的化学品,但CO_2在反应体系浓度较低而使反应速率受到限制。本论文用聚乙烯亚胺(PEI)改性聚乙烯(PE)膜,利用PEI对CO_2的可逆吸附作用,以提高CO_2在溶液中的溶解速率,促