基于知识图谱的医学文献摘要抽取方法的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:tdj_zhj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着临床医学领域的文献日益增多,循证医学相关人员需要阅读大量医学文献以获取最新研究成果。仅靠专家帮助人工总结证据费时费力,因此从医学文献中自动抽取结构化证据作为摘要,对于加快循证医学实践至关重要。目前存在药物、疾病、基因等多种医学知识图谱,包含大量结构化医学知识。现有的医学文献摘要方法主要以文本驱动,忽略了对医学知识的利用,存在以下问题:(1)医学知识的多源性:大量丰富的医学知识存储在不同领域的多个医学知识图谱中,如何利用不同的医学知识提升医学证据摘要质量是亟待解决的问题。针对此问题,本文提出跨医学知识图谱的表示学习方法。(2)医学知识的异构性:医学知识中不仅包含医学实体间的关系,还包含丰富的实体异构属性,如何利用医学知识中的异构属性提升医学证据摘要质量是另一项挑战。针对此问题,本文提出基于双重注意力机制的图卷积属性网络。本文的主要研究内容如下:(1)提出了基于跨图有偏随机游走模型的医学文献摘要方法。本文设计了单个医学知识图谱中节点游走和跨医学知识图谱节点游走概率计算模型,提供灵活的超参和可配置的得分函数用于控制跳转偏向策略,并融入了关系信息。通过利用多领域、多医学知识图谱知识互相补充,得到高质量的医学实体嵌入,然后将其应用到医学文献摘要任务。(2)提出了基于双重注意力机制图卷积属性网络模型的医学文献摘要方法。属性级别注意力机制用于计算医学实体不同属性之间的权重;节点级别层级注意力机制用于计算节点邻居权重,并考虑到了随着邻居层级距离增大导致节点影响权重逐步减弱问题。模型输出蕴含丰富医学知识的实体嵌入,然后应用到医学文献摘要任务。最后和跨图游走模型结果融合,进一步提高医学文献摘要质量。(3)设计并实现了医学文献摘要抽取系统Aceso2.0。该系统集成了跨图有偏随机游走模型和图卷积属性网络模型,用于帮助用户上传医学文献并抽取PICO相关的摘要,将结果以结构化、分类整理的形式可视化给用户。本文在UMLS等多个医学知识图谱上进行了大量实验,结果表明,本文提出的方法可以跨医学知识图谱进行表示学习,并充分利用了现有的医学知识和异构属性,有效地提高了医学文献摘要的质量。
其他文献
广义逆理论的研究主要涉及复矩阵、Banach(Hilbert)空间上的有界线性算子、环上矩阵及范畴中态射.经典的广义逆如Moore-Penrose逆和Drazin逆(群逆)在微分方程、数值分析、控制理论等众多领域发挥着重要的作用.近年来,随着广义逆理论的发展,人们引入了核逆、伪核逆、广义(伪)Drazin逆和*-DMP元.本文基于复Hilbert空间上的有界线性算子和复Banach代数,研究其上的
木质纤维素类生物质热解炭化制备炭材料是最具前景的研究方向之一。目前高品质的生物炭主要以椰壳、竹子等特殊生物质为原料,采用廉价、大宗秸秆制备高品质的生物炭是未来发展的趋势。但秸秆种类繁多,何种秸秆适合制备何种性能的碳材料,如何针对性进行品质提升,实现最优化匹配目前研究较少。基于此,本文建立了 6类大宗农业废弃物制备的生物炭和典型污染物吸附特性之间的映射关系,针对优选的原料进行改性优化匹配研究,揭示相
随着微纳光子学的发展,对光电器件进行微区光电性能表征是提升现有光电器件性能及发展下一代光电器件的必由之路。光电流扫描显微技术是光伏器件和光探测器件的微区光电表征的有效手段,已经用于多种器件的微观机理研究及性能提升工作。然而,光电流扫描显微技术难以区分结构光学和电学方面分别的贡献。为了实现对结构光学和电学影响进行区分和定量研究,本文设计并搭建了微区光电流测量系统,以砷化镓太阳能电池为例,通过单波长的
目的:分析早期胃癌(EGC)经内镜黏膜下剥离术(ESD)切除的预后及其影响因素,为EGC内镜治疗适应证的可行性及预后判断提供依据。方法:回顾性收集2014年4月至2019年3月在东南大学附属中大医院行ESD治疗的病例,纳入符合内镜治疗适应证的147例EGC病例。以同期予相同治疗的71例胃高级别上皮内瘤变(HGIN)的病例作为对照,比较两组的整块切除率、完全切除率及并发症发生率。分析ESD治疗EGC
背景:脑白质疏松症是一组由影像学描述的临床综合征,是脑小血管病的主要分型之一。越来越多的研究证实,脑白质疏松症与认知功能障碍关系密切,但其影响认知功能的确切机制仍不清楚。目的:本研究利用静息态脑功能磁共振成像技术,分析脑白质疏松症(leukoaraiosis,LA)患者静息态脑功能改变的特点,探讨LA患者认知功能损害的潜在影像学机制。方法:本研究共纳入研究对象80人,其中LA组40人,健康对照组4
目的:探究2型糖尿病患者体成分改变与胰岛功能的关系。方法:选取2018年8月至2019年3月在东南大学附属中大医院内分泌科住院治疗的2型糖尿病患者200例,其中男性122例,女性78例。行OGTT联合C肽释放试验,收集患者空腹血糖(FPG)及空腹C肽(FC-P),用C肽改良的稳态模型HOMA公式计算患者胰岛素抵抗指数(HOMA-IR)以及胰岛功能指数(HOMA-β)。并根据BMI水平将受试者分成非
沥青混合料均衡设计是近年来为应对沥青路面复杂多变使用要求而提出的新型设计方法。该设计方法主要通过混合料密实度与紧密度的平衡来实现,具体通过空隙率、矿料间隙率、饱和度等宏观参数进行控制;但这些参数难以反应混合料内部矿料的分布与接触状态等细观特征。已有研究表明,混合料内部矿料的分布与接触状态等细观特征是反应混合料紧密度的重要参数,它们对混合料的性能有着重要的影响。因此,有必要从细观角度阐释沥青混合料的
语音活动检测是一项用于区分语音和非语音的语音分类技术。语音活动检测常常被用作关键词识别系统/语音识别系统的开关,因此语音活动检测的识别率对于后级系统的正常运行至关重要;与此同时,语音活动检测模块越来越多地被用在依赖电池供电的物联网和可穿戴设备上,并且始终处于工作状态(always-on),因此降低语音活动检测功耗的需求愈发强烈。为此,本文设计了一种低功耗语音活动检测模块,通过从算法、电路两方面去优
公交车是城市最重要的公共交通工具之一,也是市民出行主要交通方式之一,在城市运转中具有基础保障作用。相应地,城市公交出行的安全保障是一项重要课题。深入分析城市公交车交通事故的成因,并开展应对措施,对于预防公交车交通事故和提高乘客出行安全具有重要意义。本文基于数据挖掘和关联分析理论,从时空特征和人为因素两个方面,研究常州市连续6年公交车交通事故数据的特征与成因,旨在解析数据间的内在联系及隐藏信息,挖掘
光子晶体(Photonic Crystals,PCs)是一种由两种或多种介电常数不同的介质周期性排列所组成的功能材料,它具有光子禁带的独特光学性质,能够阻止一定波段的光在其中传播。由于这一特性,光子晶体被广泛应用于光波导、显示、传感等领域。对光子晶体进行图案化处理使其形成特定图案或形成特定响应性图案,则能极大的扩大其应用场合。光子晶体的图案化可分为图案化的单组分光子晶体,图案化的多组分光子晶体,以