论文部分内容阅读
电子病历是基于计算机的病人记录,也可称为计算机化的病案系统。它是用计算机、健康卡等电子设备取代手写纸张病历,保存、管理、传输和重现病人的医疗记录,它的内容涵盖了纸质病历的所有信息。与传统的手写病历相比,电子病历不仅明显提高了医生的工作效率,而且可以全面的存储、管理各种信息资料。由于医学诊断的不确定性很大,所以给诊断决策增加了不小的难度;与此同时,随着医疗方面的发展,临床医学各专业越分越细,各科室医生倾向于专注自己所学的专科,导致其知识面越来越窄,这对于医生来说很难将一个病人的各方面情况进行综合的分析,从而使诊断过程具有一定的风险。因此,一个支持医疗诊断决策的医疗系统对于医生来说越来越重要。电子病历的出现使得我们能够更加方便的收集获取医疗数据,同时数据挖掘中的文本分类算法也在日趋成熟,发展成为一种有效的人工智能算法。文本在设计实现电子病历的基础上获取病人住院病历记录,并提取出所需病例描述和初步诊断结果,病例描述将作为文本分类所需的训练集,初步诊断结果作为分类类别,训练出一个智能分类的模型,然后将医师输入的新的病例描述使用建立的模型进行分类,找出疾病类别,做出智能化诊断支持。本文的主要工作有以下4个方面:(1)设计出一个电子病历系统,主要用来存储管理医院中所有病人的病案资料信息,为医生查询与病人相关治疗信息提供方便,同时也为论文后续实验提供数据支持;(2)以中铁集团二局中心医院使用的电子病历为数据源获取住院病历数据,提取出与诊断依据密切相关的病例描述,核心内容包括:主诉、病史、体格检查和辅助检查结果。使用文本预处理方法将连续的病例描述表示成一组最能反映患者病况的特征词,并进行向量化处理。(3)选取3种疾病类型共977条住院记录,使用BP神经网络算法进行分类得出具有高灵活性挖掘模型。在建立BP神经网络的分类模型过程中,改变BP神经网络的隐藏层层数和学习率,对比分析了各参数对分类准确率和各种疾病种类召回率的影响。(4)分别用BP神经网络、支持向量机(SVM)、朴素贝叶斯(NB)三种分类方法对处理后的数据进行了训练,建立了模型,经过测试,对结果进行了对比和分析。