论文部分内容阅读
随着互联网信息存储与数据处理技术的迅速发展,医院的信息化建设得到了有效的技术支持,其中对医院患者的就医记录由从前的病案室纸张记录,也转变为构建电子病历系统的数字化方式。电子病历数据作为患者就诊过程中信息的重要载体,为智能辅助医疗决策研究提供了数据支持。但由于电子病历数据存在形式多样,如表格、数字与自由文本等,非结构化文本数据中包含大量专业化描述等特点,也产生了对电子病历数据预处理、数据的标注均耗时耗力等问题。为了更加有效挖掘电子病历的潜在价值,利用已有临床诊疗经验,很多学者结合机器学习技术对医疗辅助决策方法进行研究。针对以上电子病历数据特点以及研究过程中的问题,结合在标注样本较少实际问题中机器学习方法的应用,本文拟采用半监督学习方法,在结合少量标注数据的基础上,从患者相似群组和医嘱方案选择两个方面出发,对医嘱辅助决策方法进行研究。主要包含以下三部分内容:(1)数据预处理研究。本文针对电子病历多类型数据进行了归一化与标准化映射,同时考虑其自由文本比重较大、内容具有领域专业性特点,在文本分词时结合构建领域词典辅助分词,并通过对比实验验证了该方法对医疗专业术语识别的有效性。(2)患者相似组类别划分研究。本文综合考虑了患者基础与诊疗信息进行患者属性体系构建,同时基于多指标考量对患者间相似程度估计,构建成对约束集合作为监督信息用以指导半监督聚类学习模型,优化患者相似组类别划分效果。(3)医嘱辅助决策方法研究。本文提出在医嘱列表选择过程中,首先将医嘱按诊疗方案类别进行初步归类,综合考虑患者相似性以及医嘱类别对医嘱选择的影响,根据患者相似度、不同诊疗方案的重要性,以患者、诊疗方案两个维度更加细粒度的分析计算每条医嘱的总体相关性情况。本文通过多组对比实验,证明基于半监督学习的患者相似组划分优于单纯的无监督聚类算法,综合考虑电子病历多维度属性信息与患者成对约束信息,并将诊疗方案类别辅助患者与医嘱的关系考量,能够提升医嘱辅助决策模型的效果。本研究所提出的基于半监督学习的聚类方法能够更好的适用于医疗数据的研究,在此基础之上所构建的基于患者相似度、医嘱与患者相关性分析的医嘱辅助决策思想可以帮助更好的利用已有数据资源辅助临床医护人员诊疗,同时采用适当的诊疗方法,提高开具医嘱的效率和准确性。