知识发现在2型糖尿病数据处理中的应用研究

来源 :2004中国卫生信息技术交流大会 | 被引量 : 0次 | 上传用户:slowfast1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将知识发现理论引入到2型糖尿病发病相关因素数据处理中,从大量实测数据中识别出有效的、潜在的、有用的、可理解的发病规律.方法:根据2型糖尿病数据的特点,选用数据挖掘C4.5算法对17072条有效的整群抽样横断面健康调查数据进行决策树分类.结果:通过训练模型给出糖尿病患病与滞的决策分类树,该决策树可以直观地给出发病相关因素的不同层次的相对影响,经实验测试结果对于未患病的正确识别率为92.05﹪,对于患病的正确识别率为80.90﹪.结论:决策分类树结果同目前认识的高危因素率为80.90﹪.结论:决策分类树结果同目前认识的高危因素趋于一致,说明数据挖掘C4.5算法适用于用于2型糖尿病的发病相关因素数据分析处理,是2型糖尿病数据处理的一种新方法,其在疾病的宏观控制中有着广阔的应用前景.
其他文献
可扩展标记语言XML已逐渐成为了WWW中业务数据的交换标准,利用XML文档作为载体可以在各种异构的业务系统间交换信息,具有灵活、方便、快速的特点。该文提出了一种XML与传统关系
基于大规模分布式WWW搜索引擎系统——北大“天网”的用户日志,该文研究了搜索引擎用户访问量建模分析和预测的一般方法;将用户的访问量看成按时间次序排列的随机变量序列,利用
常规的蠕虫防治策略中网络管理人员处于被动地位,蠕虫爆发后会在网络中长期泛滥,无法得到有效抑制。该文通过对经典蠕虫的分析,给出了蠕虫疫苗的定义(为破坏蠕虫传播流程中的某
控制时延对流量控制算法的有效性起着重要的作用。该文提出了一种ABR业务流量控制方案,通过交换机和信源交互发出RM信元,有效地减小了控制时延。仿真表明,该算法在迅速减轻拥塞,
物理过程失效的研究对于非能动系统来说是十分重要的,目前重要抽样的蒙卡方法应用最广.但是该方法寻找设计点时要依赖于一次二阶矩法,还要对参数标准正态化,本文提出的基于自
三层实时提交协议(3LRTC)是为支持事务移动性、断接性、实时性及功能替代性等设计的一种移动实时提交协议,该协议能保证移动分布式实时事务放松原子性和结构正确性。该文在分
文章阐述了施工工艺的质量控制要点及主要影响因素,并分别叙述了质量控制的事前、事中、事后全过程质量监控工作。
研究性学习是目前较受推崇的一种新型教学理论,它强调学生的主体作用,要求学生全员参与.充分调动学生的积极性、实践性,全面提高自身素质,教师在这一如既往过程中起着主要引
1.你属于哪一个星座?A.白羊座、天秤座、巨蟹座、摩羯座(2分)B.双子座、射手座、处女座、双鱼座(3分)C.金牛座、天蝎座、狮子座、水瓶座(1分)
研究分析了加速器驱动洁净核能系统(ADS)中钨靶受质子照射一段时间后在水体中产生的辐射剂量分布和辐射剂量随存放时间的变化规律.研究结果表明:钨靶的散裂产物中长寿命放射性核