论文部分内容阅读
随着中医临床研究的深入,医院信息化进程的加快,医院病案数据库中累积了大量的原始并未处理的病人处方数据,而伴随着这些数据的迅猛增加,医生现在很难依靠传统方法在短时间内通过简单的处理与归纳、总结这些处方数据来获知里面所包含的大量有用信息与经验。这时我们必须通过新的技术手段,来实现中医治疗经验的继承与创新。数据挖掘(Data Mining,DM)一种能自动获取有用信息,分析信息间潜在联系的知识发现信息处理技术,将其应用于医院病人处方数据信息特征分析,可从中发现里面所蕴含的潜在治疗规律与新的治疗理论方法,有效实现中医经验的总结与传承。本文的重点在于通过实例对数据挖掘技术中的关联规则各算法进行了详尽分析与研究,总结了各算法的优缺点,同时针对关联规则传统算法的不足,引出了一种基于数据拆分技术的分布式FP-growth算法并作了详细算法的分析,又在其算法理论基础上,根据医院门诊处方中存在大量同一病症重复处方的问题结合中医数据特点,提出了一种适合门诊处方数据挖掘的分布式FP-growth改进算法并选取了浙江省中医院医院信息系统(Hospital Information System,HIS)门诊数据库中国家级名老中医哮病治疗处方数据作为挖掘对象,从中发现了“药-症”,“药-药”之间潜在关联模式,结合中医典籍资料初步分析评估了这些关联模式所生的治疗规律的正确性,验证了数据挖掘关联规则技术在中医处方分析与研究上的适用性与可行性并在该理论基础上设计与实现了分布式FP-growth改进算法医院处方数据挖掘系统。