论文部分内容阅读
随着信息技术的不断发展,每年由智能医疗仪器产生的医学数据呈现爆发式的增长。当前人们对于数值、文本型医学数据的研究还只是局限于简单的统计分析,并没有深层次挖掘这些数据背后的隐藏信息。本文通过引入一些机器学习算法挖掘这些数值、文本型临床数据与疾病之间的联系,从而为疾病的诊断治疗提供决策支持,具体研究内容及结果如下:1)构建小儿肠梗阻患者下一阶段诊治方案决策模型。本文使用深度神经网络算法对小儿肠梗阻患者的血常规以及肝肾功能检查指标进行模型的训练。针对数据样本不完整的情况时,分别尝试了不同的插值方式来训练模型。最终采用了“类别均值”的插值的方式来填补这些空缺数据,这样既可以避免样本数据信息的丢失,也可以较大程度使得填补数据符合原始真实值。并使用基于Gini系数的特征重要性评价指标对各个特征的重要性进行评分,选取一些重要性显著的特征作为医生诊断参考的指标。为了评估模型的稳定性,本文使用了5折交叉验证来检验模型。实验结果表明,模型的分类性能能够为医生提供辅助性的决策建议。2)构建小儿腹股沟疝患者伴随肠道坏死并发症诊断模型。本文根据收集的数值型临床数据的自身特性,分别对血常规、肝肾功能检查指标进行建模分析。针对实验中出现的数据不平衡问题,本文采用了基于投票的集成方法来处理该问题。首先将多数类别的样本数据平均划分成多个子样本,将每个子样本分别与少数类样本构成平衡数据集。然后分别对平衡数据集进行训练,将训练的众多模型组合成集成学习模型,模型之间的投票结果作为集成学习模型的分类结果。之后本文还对模型特征做了进一步的优化工作,将特征的重要性作为迭代的基础逐次添加特征值并训练模型,根据模型性能选择最优的特征组合。经过实验验证,使用特征优化之后的数据集训练的模型准确率有86.43%,性能要优于原始检查参数训练的模型。因此特征优化后的模型能够在医生诊断小儿腹股沟疝患者是否伴随肠道坏死并发症时,提供辅助性的决策支持。综上所述,本文在面对数据冗余、缺失和不平衡等情况时,分别使用了统计分析、插值以及集成学习等方法来处理医学临床数据中的这些常见问题。本文基于数值型临床数据构建的辅助决策模型在确保准确率的情况下,并能够针对分类结果给出合理的医学解释。它使得辅助决策模型在该类数据上的应用具有重要的意义。