论文部分内容阅读
随着信息技术的发展,电子病历的使用越来越普遍。以出院小结为核心的电子病历成为医疗领域的重要数据,为医学研究和医疗应用提供了支撑。电子病历的书写已经成为医生日常工作中非常重要的部分,占据医生的大量的工作时间。据报道,书写电子病历占据医生60%的工作时间,远远多于患者就诊占据的时间。为了把医生从繁重的电子病历书写任务中解放出来,本课题系统地研究了中文出院小结自动生成方法,主要包括基于抽象生成的出院小结生成方法、基于选择的出院小结生成方法和基于预测的出院小结生成方法。本文在国内某三甲医院随机选取的1038位患者的电子病历组成的数据集上,对上述方法进行了评估。基于抽象生成的出院小结生成方法对按时间排序的患者就诊历史信息,包括入院记录、病程记录、检验报告、检查报告和手术记录等,直接进行神经网络编码,然后利用神经网络解码生成患者的出院小结。生成的出院小结和医生书写的出院小结之间的ROUGE-1、ROUEG-2和ROUGE-L召回率分别是0.21,0.09和0.19。该方法生成的出院小结完整性较差、质量偏低。主要原因在于历史信息拼接形成的输入文本过长和章节依赖关系欠缺。基于选择的出院小结生成方法通过对历史信息中的句子进行选择生成出院小结的摘要,包括基于规则的选择和基于序列标注的选择两种方式。前者总结历史记录与出院小结章节之间的对应关系,自动选择历史记录中的句子,后者判断历史记录中的每个句子是否应该被选择到出院小结。基于规则的选择方法的ROUGE-1、ROUGE-2和ROUGE-L召回率分别是0.336,0.215和0.331,基于序列标注的选择方法的ROUGE-1、ROUGE-2和ROUGE-L的召回率分别为0.689,0.437和0.629。实验结果表明,基于序列标注的选择方法更优,且生成效果优于基于抽象生成的出院小结生成方法。基于预测的出院小结自动生成方法对出院诊断和出院带药进行预测生成。该方法利用深度学习模型,根据历史信息预测出院诊断和出院带药。一方面,该方法把出院诊断和出院带药当作独立的预测任务;另一方面,把两者当作多任务联合学习问题。结果显示用多任务学习技术对出院诊断和出院带药预测能取得最优的性能,其中出院诊断预测结果的微平均准确率、召回率和F1值分别为0.91、0.83和0.87,出院带药预测结果的微平均准确率、召回率、F1值分别是0.66,0.73和0.70。