基于深度图挖掘的医学概念表示

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:limihu93
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医学临床数据可视为患者在一次或多次住院过程中产生的一系列临床事件的集合,包括药物记录、疾病诊断记录、生理指标、化验结果、非文字记录(医学影像、心电图、录音等)、既往史、遗传史、诊疗费用等,这些事件记录在电子病历中,其复杂性现已接近基因组规模,通过对多种临床事件的分析,研究者能够更加灵活地对患病风险进行预测建模,对于疾病的早期发现和治疗具有重要的意义。然而,正是由于临床事件的复杂性和多样性,如何更好地利用临床事件对未来疾病进行诊断预测尤其具有挑战性。而医学概念是指药物记录、疾病诊断记录等蕴含丰富语义信息的临床事件,与血压、血糖测量值等数据不同,医学概念中隐含着大量语义关系,各种概念之间存在复杂的潜在联系,如何更好地进行医学概念的表示学习是准确把握患者信息的关键,对提高疾病预测精度尤为重要。目前,利用医学概念展开疾病诊断预测主要面临三个挑战:第一,医学概念表示问题,即如何有效利用医学概念隐含的语义信息。多数研究采用独热向量来对医学概念进行表示,使得输入矩阵高度稀疏,同时造成丰富语义的丢失。第二,临床事件时间依赖问题。时间信息对于患者病程发展尤为重要,相对早期事件,晚期事件更具价值。且临床事件之间的时间间隔不规则,导致难以采用传统模型进行分析。大部分方法对所有临床事件做等间隔处理,无法综合考虑患者长短期患病信息。第三,临床事件种类繁多,呈现异构形式,各种事件关系需要更好的融合。很多研究根据专家知识选取单一事件进行建模,未利用多种事件之间隐含的关系,仍需要进一步改善。针对上述问题,本文展开了医学概念表示与临床诊断预测两方面的研究,建立了基于深度时控图卷积的医学概念表示方法,解决语义损失、输入矩阵稀疏问题,充分利用时间信息、语义信息及事件关系,对多种疾病临床诊断进行预测。本文的主要创新成果如下:(1)针对语义损失、矩阵稀疏问题,开发了一种医学概念细粒度表示形式。捕获医学概念中隐含的字符级语义信息,建立包含稀疏性约束的嵌入式表达。首先,对医学概念进行细粒度分割,分析概念内部结构,捕获字符级医学概念信息。其次,考虑医学语义相似度对词向量进行字符级共享表示,保留丰富的医学专业语义信息。再次,在公开数据集上进行实验,证明所述医学概念表示形式拥有较好的聚类效果,能够为后续预测工作建立良好的基础。(2)提出一种可对不同时间间隔进行建模的长短时记忆递归网络,综合考虑长短时事件对疾病诊断进行预测。首先,提取患者历史临床事件,根据时间顺序构建完整的患者病程向量。其次,在长短时记忆网络结构中添加时间控制单元,对不同时间间隔事件进行加权建模,使得模型拥有处理变长间隔事件的能力,消除了临床事件对时间戳的强烈依赖,能够综合考虑病人长短期患病事件。再次,在真实数据集上进行了大量对比实验,结果表明,所述可变间隔结构能够显著提高预测模型精度,具有很强的竞争力。(3)构建了面向多维事件的临床预测模型——深度时控图卷积模型,提高临床诊断的准确性。首先,综合考虑多种临床事件,针对事件多维、异构的特征,面向各类事件关系生成异构图;其次,对所构建的多元异构生成图进行卷积操作,建立融合各类事件关系的表达。再次,将时间控制单元与图神经结构结合,构建深度时控图卷积模型,从而处理带有时间信息的多维数据。本文在大型多参数重症监护公共数据库MIMICIII数据集上进行广泛实验,并客观全面评价模型性能。结果证明,深度时控图卷积模型在临床事件预测领域中实现了更高的精度,对医学信息研究具有重要意义。
其他文献
碳纤维复合材料和铝合金因其优良的特性被广泛的应用到汽车等领域中。但随着科技的发展,工业中迫切需求结构复杂的构件。因受到制备工艺的制约,直接制造大型且复杂的构件相当
类石墨烯材料,特别是过渡金属硫化物(TMDCs)因其与生俱来的带隙和优异的物理性质引起了广泛的研究。由过渡金属硫化物材料组合成的混合系统为电子和光电性能方面提供了更多机会
在本论文中,我们引入了与Zygmund伸缩相关的加权Carleson测度空间,证明了此类加权Carleson测度空间的合理性;研究了此类空间的相关性质,其中包括稠密性质,以及此类加权Carles
聚四氟乙烯(PTFE)广泛应用于航空航天、石油化工、机械、电子、建筑、轻纺等工业部门,但其有难溶解、超高的熔体粘度、难加工等缺点,目前采用填充改性、表面改性等方法对PTFE
黄河三角洲环境复杂,生物多样性丰富,是研究土壤微生物驱动碳氮时空变化最有优势的天然实验室。本研究选取黄河三角洲四种典型样地包括滩涂裸地、翅碱蓬群落样地(Suaeda salsa(L.)Pall.)、芦苇与翅碱蓬混生群落样地(Ass.Phragmites australis(Cav.)Trin.ex Steud.+S.salsa)以及芦苇与柽柳混生群落样地(Ass.P.australis+Tamar
二连盆地拥有丰富的陆相油气储量,其中阿南凹陷作为二连盆地剩余资源量较大的凹陷之一,是二连盆地陆相勘探的重点目标。本文以阿南凹陷下白垩统的腾格尔组和阿尔善组烃源岩和原油为主要研究对象,运用有机地球化学的相关原理和方法,对不同地层的烃源岩和原油地球化学特征进行了系统的研究和探讨,并对不同层段、不同地区的烃源岩和原油咸化特征进行了分析。研究发现:有机质丰度、类型及成熟度特征显示阿南凹陷的烃源岩生烃有利层
纳米碳作为一种高附加值含碳产品,在能源储存、转化设备、生物传感器、电子纳米器件和水处理领域有很大的应用。但是目前制备碳纳米材料的方法都存在着制备工艺复杂、污染严重、能耗高等问题,使得纳米碳材料的绿色大规模制备变得困难。因此,开发一种绿色环保、工艺简单的合成纳米碳材料的方法显得格外重要。针对上述的问题,本文以LiH为原料,分别以二氧化碳(CO_2)和金属碳酸盐(Na_2CO_3)为碳源,系统研究了L
Diels-Alder(DA)反应因其具有出色的热可逆性、高收率、副反应少及温和的反应条件,特别适合于制备热刺激的自修复聚合物。DA反应已广泛应用于聚酯、环氧树脂和聚氨酯,但仍很
近年来,我国的道路交通发展十分迅速。曲线梁桥被广泛应用于公路建设当中。例如,在河型立交桥和河跨度桥梁的引桥中,不可避免要采用曲线梁桥。不仅如此,随着当前行车密度的不断增加,车辆行驶速度和载重的不断提高,使得车辆对曲线梁桥的影响越来越河。相对于直线桥而言,曲线梁桥受力复杂,更容易产生畸变和翘曲。在工程中,通常设置横隔板来减小这些变形。虽然已经有很多专家学者从静力计算河论出发,研究了横隔板对曲线梁桥的
新城疫(Newcastle disease,ND)是由新城疫病毒(Newcastle disease virus,NDV)引起的鸡、火鸡和多种禽类的急性、高度接触性传染病,严重危害禽类。H9N2虽是低致病性禽流感,但