论文部分内容阅读
近年来,随着数字医疗在全球范围内的普及,医疗行业的人工智能应用也逐渐开展,死亡预测、癌症诊断、医学影像识别等研究相继问世。现阶段人工智能技术在医学临床应用方面仍存在三点挑战:首先,现有的医学人工应用大多关注于医学影像处理和结构化数据预测的阶段,对非结构化的电子病历文本数据的深度挖掘和辅助诊断仍处于起步阶段;其次,现有的临床决策支持系统大多是以知识库为基础的逻辑推理,导致每当扩展到一种新疾病时,专业医护人员前期预处理工作的复杂度呈几何倍数增长,从而阻碍医学人工智能算法的大规模推广;再次,临床决策支持系统难以从病历文本中精确提取患者的特征信息,导致了辅助诊断算法无法对相似疾病做出准确诊断。总之,现有工作普遍缺乏一种既能符合临床诊断需要、又能有效提高诊断预测精度的智能算法。为了解决上述挑战,本文提出了一种整合自然语言处理和深度学习方法的儿科临床辅助诊断算法(称为NLP-BiRNN),旨在通过对海量文本病历的学习,辅助临床经验不足的儿科医生进行快速准确的诊断预测。本文的主要研究内容包括:第一,针对电子病历中自由书写的无格式文本,提出了一个面向海量中文病历文本的自然语言处理解决方案;第二,使用双向循环神经网络方法对处理过的海量中文病历文本数据进行深度学习模型训练;第三,本文在81,476条某三甲医院的儿科电子病历数据集上进行大规模实验,验证了本文算法的有效性。NLP-BiRNN算法比基线算法(如CNN、RNN等)的预测精度提升了约3.5%~6.5%。本文的研究成果,一方面能够帮助临床经验不足的医生或缺乏专业儿科医师的社区门诊医院进行快速准确的诊断,使患者得到及时有效的诊断,进而达到优质医疗资源向社区医院或乡村医院辐射的良好效果;另一方面,本文所提出的面向海量中文电子病历的自然语言处理解决方案,能够辅助临床医生及医学专业学生快速准确地找到患者的核心症状信息,以有效辅助医学临床决策。