基于深度学习的医疗复合实体上下位关系识别

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:aulxbdmmydb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在专业领域的知识库中,经常出现由一系列词组合成的长实体,这类实体具有词的可组合性和可扩展性,医疗领域的疾病和症状就是典型的例子。本文把这类不同于传统实体的概念,称为复合实体,并且探索针对这类实体的上下位关系识别方法,这对于知识库构建等任务是十分有意义的。传统实体的上下位关系识别方法,在复合实体上表现不佳,主要因为以下两方面原因:1)缺少包含这些复合实体的文本,专业领域语料通常较为缺乏,难以获取;2)复合实体结构复杂、形式多变、同义词多,直接将实体作为一个整体,容易出现测试集中未登录词多的情况。在本文中,我们提出了一种混合注意力机制,并构建了利用混合注意力机制的双向GRU胶囊网络模型(HA-BGRU-CapsNet模型)用于识别医疗复合实体上下位关系。混合注意力机制由启发式注意力机制和相似度注意力机制组成,这种注意力机制弥补了复合实体缺少上下文的难点,分别从实体间的结构相似性和语义的相似性启发模型。针对复合实体未登录词多的现象,模型使用双向GRU将实体中的词向量编码成实体向量。最后使用胶囊网络的输出胶囊模长来判断输入实体间是否存在上下位关系。本文利用SNOMED-CT和中文医疗网站构建了中英文复合实体数据集。在中英文数据集上进行实验,实验结果显示,相比其他常用方法,该模型有着更好的效果。本文也在公开数据集上实验针对复合实体设计的注意力机制的效果,结果显示针对不同型的实体,注意力机制产生的效果不同,有时可以提高模型效果,有时降低模型效果,在实际应用中,需要明确目标实体是否适合使用注意力机制。
其他文献
税收风险管理是深度融合于税款征收、税源管理、纳税服务等各个税务环节的现代化税收治理方法。近年来随着经济形势的变化,我国征管规模越来越庞大,减税降费政策落地使得税收增长明显放缓,有限的税收征管资源难以满足日益激增的纳税人办税需求,扎紧税收风险管理的口子,是税务机关聚焦组织收入主责主业、确保减税降费政策落地落实的重要措施,是确保营商环境优化,稳步提高纳税遵从的关键举措。实施税收风险管理是现代税收管理发
金融数据作为一种具有高噪声、非线性的复杂时间序列数据,常被作为时间序列研究者的首选。股票市场作为金融市场的代表性数据,可以用其来衡量金融市场的发展情况。为了研究股票市场的发展趋势,将分析股票市场方法分为两个方面:基本面分析和技术分析。基本面分析从国家宏观指标、经济政策等方面出发,结合金融经济理论,分析股票的趋势;技术分析则是通过研究股票市场的数据,提出相关理论以及研究技术指标等发现股票趋势。股票市
美食文化传承至今,已经演变出了多样的形式和丰富的含义。自从《舌尖上的中国》热播之后,纪录片影像已经成为了传播美食文化的重要方式。美食纪录片以美食为桥梁,在传递美食文化的基础上,展现了区域的自然风光和人文精神。再现理论是分析美学的重要理论,源起古希腊时期,经历了从“摹仿”到“再现”的变迁。研究学者众多,如亚里士多德、古德曼、沃尔海姆等。最初,再现是从绘画的角度来研究艺术作品,但随着时间的推移和艺术形
随着互联网技术的迅猛发展,微博等社交平台日渐成熟,用户量剧增导致文本数据爆炸式增长,并且用户所发表的言论简短,口语化严重,导致准确地识别文本中隐含的情感信息更加困难。传统的情感分析方法主要依靠人工构建情感词典,并且需要针对不同领域的语料选择不同的特征选择方法,费时费力,已无法满足短文本情感分析的需求。因此,本文结合深度学习的方法,开发了一个基于深度学习的社交平台情感分析系统。主要研究工作如下:1)
栀子黄是一种安全的天然色素,探究其与活性红3BS在乙醇/水体系中对蚕丝的染色,可进一步发挥出清洁化染色技术的优势,减少环境污染,促进天然色素与化学染料的协同发展。为了探究前处理对蚕丝染色性能的提升性,利用Na_2CO_3、碱性蛋白酶和TEP-90改性剂对蚕丝进行前处理,以减重率为指标简要探究了Na_2CO_3和碱性蛋白酶对蚕丝的最佳脱胶工艺,以断裂强力为指标简要探究了改性剂对蚕丝的最佳改性工艺,并
为了培养新时代中国特色社会主义事业合格的建设者和可靠接班人,培养有信仰、有思想、有尊严、有担当的四有公民,我们必须解决好培育什么人、怎样培养人、为谁培养人这个根本问题。基于2017年新版《普通思想政治课程标准》的修订,明确了普通思想政治课程修订工作的主要任务,在任务中首要提出了通过凝练核心素养,推动落实“立德树人”根本任务。在基本理念中,构建以培育核心素养为主导的活动型学科课程。这不仅有利于达到教
近年来,恶意URL日益增长且变化多样,差异性较小,难以区分,致使恶意URL检测研究变得愈加困难。现有的恶意URL检测研究大多是基于传统、单一的机器学习算法研究,这些算法函数计算较为简单且不能自动获取更多的URL特征进行学习分析,而且泛化能力效果不理想,恶意URL检测研究的准确率效果不佳。本文将恶意URL数据集Phish Tank和爬虫抓取良性URL组合成数据集作为实验数据,研究设计了深度学习算法模
国家实施创新驱动战略以来,新型研发机构作为科技机制体制创新的有力抓手被提到了前所未有的战略高度,各个地区都在如火如荼地改善新型研发机构的建设。新型研发机构类似于一个创新生态系统,能有效克服一直以来面临的科技与经济相脱离的创新难题。但由于新型研发机构数量分布不均、质量参差不齐,有部分机构存在自我造血能力不足、创新效率低下等发展问题,其如何提升创新绩效实现可持续发展引起了人们的重视。关于其创新绩效的研
磁场调制式磁力齿轮内外转子永磁体产生的谐波经过调磁环的磁场调制作用实现传递转矩,是一种无接触传动装置,有效避免了机械齿轮带来的摩擦、噪音、润滑等问题,在现在工业生产中越来越受到重视。本文主要通过改进磁力齿轮的结构来提升磁力齿轮的转矩稳定性。在尺寸和永磁体用量相等的前提下,从增大输出转矩和减少转矩脉动两个方面来提高磁力齿轮的传动稳定性。首先本文介绍了磁力齿轮的拓扑结构及工作原理,分别分析了内、外转子
本文以湖南某边坡滑坡造成抗滑桩断裂的工程实例为本文的研究背景,通过研究边坡地质报告和进一步勘察分析得出结论,认为降雨入渗导致二元结构(黏土-软岩)边坡中的碳质页岩软化形成软弱夹层,在开挖卸荷引起应力重分布和降雨形成的水压力作用时,边坡发生滑坡导致抗滑桩断裂的工程问题。因此针对目前国内外研究者很少同时考虑低应力水平及水力作用的叠加效应对二元结构边坡稳定性的重要影响,文中认为推导二元结构边坡水力学分析