论文部分内容阅读
随着医疗信息系统的不断完善和改进,各医院存储的电子病历的数据种类越来越多,数据量也越来越大,对于电子病历的分析和研究已是一个具有挑战性的课题,如何将此部分数据合理的利用起来,使用先进的数据挖掘算法、合理的分析工具也成为各界关注的焦点。心血管疾病是目前危害人类健康的重大疾病,心力衰竭作为各类心血管疾病发展的终末阶段,发病率、死亡率始终处于较高的水平,尽早的发现心力衰竭可以大量减少个人和社会在治疗、管理心衰方面的负担。 从数据挖掘的角度来看,如何将医疗数据合理有效的利用起来并且给出相应辅助决策还是有一定难度的,首先要从庞大的数据集中提取出可利用信息,再使用合适的数据挖掘算法对病例数据进行分析,最后将算法理论结合数据应用于实际医疗决策中。以上难点是攻克数据挖掘在医疗领域实现的技术关键,同时也是实现辅助决策的关键。 本文主要的研究工作有如下几点: (1)使用心衰病例数据整合及相关数据预处理方法得到病历数据集,利用Apriori算法在已有病例数据集中发现频繁项集以及关联规则; (2)对频繁项集数据上实现信息增益率加权算法对各个危险因素进行评析,评选出危险因子较大属性并依此对病例数据再分组,可以得到分类器在不同的分组的数据集上精确度会有不同程度的提高; (3)将ELM、AdaBoost等经典分类器实现在不同数据分组,对比并讨论不同的效果,并评选出再医疗数据中表现较为良好得分类器; (4)使用现有开发技术框架并结合前文实现中最为合适的分类算法,初步实现医疗辅助决策系统平台。本文探索了数据挖掘技术在医疗领域的应用,研究并讨论了相关算法在医疗数据集上的实现。