论文部分内容阅读
脑血管病是危害中老年健康的常见疾病,因其治疗和护理周期长、复发率高等特点,成为各地医疗中心的主要负担。同时,各级医院医疗信息化过程中积累的脑血管病电子病历和患者档案等数据,结合深度学习等人工智能技术,成为了解决脑血管病辅助诊疗问题的新思路。基于上述背景,本文从分析脑血管病电子病历辅助诊疗研究现状入手,通过引入深度学习算法模型,找到了弥补电子病历数据不完整、医疗中心数据模版不统一、大规模医疗语料库缺失等局限性的突破口,即通过命名实体识别技术和图嵌入技术的融合,在海量电子病历数据中提取关键信息,构建相似病历检索模型,并可基于此模型结果实现脑血管病电子病历辅助诊疗应用场景的扩展。本文的研究内容主要有以下几点:(1)引入注意力机制的命名实体识别研究:针对中文电子病历医疗模版不统一和缺少大规模语料库的问题,将引入注意力机制的Bi-LSTM-ATT-CRF命名实体识别模型引入相似病历检索研究中,通过计算注意力权重提取电子病历关键信息,突破电子病历模版限制;通过半监督学习方式,解决语料库缺失问题;(2)基于脑血管病命名实体网络和图嵌入node2Vec的相似病历检索模型研究:针对中文电子病历数据记录不完整的问题,通过图嵌入技术node2Vec将云平台脑血管电子病历数据网络化表示学习,通过随机游走技术挖掘网络中的隐藏关系,获取电子病历的篇章向量表示,通过余弦相似度计算电子病历相似度;(3)相似病历检索模型的应用:结合天坛医院脑血管病协同防治云平台信息共享的现状,实现云平台下基于相似病历检索模型的脑血管病辅助诊疗应用。通过对脑血管病电子病历辅助诊疗的研究,得出了以下结论:(1)通过与条件随机场、Bi-LSTM以及Bi-LSTM-CRF的对比实验,证明了引入注意力机制的Bi-LSTM-ATT-CRF模型在医疗命名实体识别领域的适用性;(2)通过与空间向量模型和LDA主题模型的对比实验,证明了通过融合命名实体识别技术和图嵌入技术可以有效提升医疗相似文本检测的效果;(3)通过实际应用,证明了本文提出的模型结果可以扩展电子病历辅助诊疗的应用场景,实现从相似病历检索、病症分布分析和诊疗手段效果分析三方面帮助医生快速匹配脑血管病症状相近的病历表现,找到关联案例,实现脑血管辅助诊疗,提高医生的工作效率。