论文部分内容阅读
将知识发现理论引入到2型糖尿病发病相关因素数据处理中,从大量实测数据中识别出有效的、潜在的、有用的、可理解的发病规律.方法:根据2型糖尿病数据的特点,选用数据挖掘C4.5算法对17072条有效的整群抽样横断面健康调查数据进行决策树分类.结果:通过训练模型给出糖尿病患病与滞的决策分类树,该决策树可以直观地给出发病相关因素的不同层次的相对影响,经实验测试结果对于未患病的正确识别率为92.05﹪,对于患病的正确识别率为80.90﹪.结论:决策分类树结果同目前认识的高危因素率为80.90﹪.结论:决策分类树结果同目前认识的高危因素趋于一致,说明数据挖掘C4.5算法适用于用于2型糖尿病的发病相关因素数据分析处理,是2型糖尿病数据处理的一种新方法,其在疾病的宏观控制中有着广阔的应用前景.