论文部分内容阅读
医生做出诊断决策的思维方法之一是类比推理。类比诊断法是指医生将症状,体征、辅助检查资料等综合在一起,与疾病理论模型或者疾病经验模型进行对照,经过比较、鉴别、推理,从而得出疾病诊断结果。面向诊断决策支持的类比推理的核心挑战之一是精准地定量评估患者间的相似性。当前的研究方法一般是利用检查检验数据使用传统的距离度量方法计算患者相似度。其局限性在于未能充分的利用各种类型的临床数据,未能考虑在不同场景下患者相似度是随观测视角变化的,未能考虑计算过程是否符合医生的思维逻辑。如何综合利用多种类型的临床概念针对不同的场景设计符合医学类比推理思维的数学模型来计算患者相似度,目前仍是挑战。本文综合利用多种类型的临床数据,针对面向诊断决策支持的患者相似度计算方法开展了研究,研究内容主要包括以下几个方面:(1)提出了一套面向患者相似性计算的多种语义空间中临床数据的规范化处理方法蕴含医学知识的临床数据不能直接应用于患者相似性计算,首先应做规范化处理。本论文分析了病历文本、检查检验、疾病诊断、药物四类临床数据的特点,提出了相应的规范化处理方案。对于病历本文,本论文提出一套表示病历文本语义内容的医学术语关键词向量的构建方法,包括症状术语识别和阴阳性检测等;对于检查检验概念,采用引入正常参考范围的z值法和独热编码法对数据进行规范化处理;对于疾病诊断概念,提出了一套自动分配具有层次结构的分类型ICD编码的方法;对于药物概念,提出了一套基于药物与疾病的相关性的编码分配方法。-(2)提出了一套基于层次结构的语义空间计算临床概念和概念集相似性的方法临床中存在大量具有层次结构的临床概念,其中疾病诊断是最重要的临床概念之一,也是患者相似性的重要评估指标。利用疾病诊断概念的具有层次结构、蕴含医学知识的ICD编码,本论文提出了一套基于ICD编码信息量的疾病诊断概念间相似度和概念集合间相似度的计算方法,系统评估了各步骤多种实现方式,并讨论了各方法组合的适用场景、效率效果。该方法普遍适用于在具有层次结构的语义空间中计算临床概念间和概念集间的相似性。(3)提出了一套面向诊断决策支持的患者相似度计算方法预测疾病诊断集是多标签分类问题,常规方法是将该问题转化为多个独立的二分类问题,忽略了疾病间的相关性。受心理学结构映射理论启发,本论文设计了一套基于患者相似组的疾病诊断预测模型,将多标签分类问题转化为单值回归问题。为满足结构一致性约束,模型的输入是患者对的属性相似性,即将症状等医学术语关键词、检查检验、入院疾病诊断三类属性对齐后逐一比较得到的特征向量,模型的输出是基于ICD编码的患者对的出院疾病诊断集的相似性,通过大数据训练得到患者对关系相似性的预测模型。最后基于正类比生成诊断假说,基于负类比排除诊断假说,得到最终的疾病诊断集预测结果。该模型保留了疾病间的相关性,在真实案例实验中预测表现优于基线方法。患者相似性可用于构建患者相似网络,本论文探索了如何利用多内容(content-rich)的患者相似网络开展诊断决策支持。患者相似网络是根据入院疾病诊断集间的相似度构建的,网络结点的内容是病历文本。满足结构一致性约束的病历文本处理方法忽略了除医学术语关键词之外的文本内容。受心理学约束满足理论启发,采用基于词嵌入的方法构建病历文本的内容嵌入,能够更充分的表示语义内容,满足语义相似性约束。基于图卷积神经网络的方法通过学习病人结点的表示向量来预测病人的分类标签,能够得到针对该分类任务的病人表示和病人相似度,满足语用中心性约束。该方法适用于其它基于患者相似网络的多类别分类问题,在真实案例实验中预测表现优于基线方法。