数据挖掘在糖尿病数据中的应用研究

被引量 : 11次 | 上传用户:ivanny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的进步与发展,威胁人类健康的疾病谱正在变化。慢性非传染性疾病对国民、尤其是老年人群的健康的威胁越来越大,最为明显的是2型糖尿病在全球范围内的几近流行的上升趋势。2型糖尿病的隐匿起病、患病率随年龄增大而增加等特点表明这一疾病发展为一渐进型糖尿病,对发病进行控制首先涉及对这一疾病的了解。了解这一疾病发生发展的规律,针对重要途径、重点人群入手,才能达到理想的预防和诊断效果。探讨2型糖尿病发病规律是控制其发生的重要、基础的一步。 对控制糖尿病这类非传染性疾病的传统研究用的是线性还原式的研究方法,但这种方法现在看来,存在着相当的局限性。针对传统研究的局限性,本文尝试用生物信息学的思想来发现规律。数据挖掘是生物信息学的一个主要技术,本文将数据挖掘算法引入2型糖尿病的发病规律研究中,希望从大量的糖尿病数据中学习2型糖尿病的发病规律的知识,挖掘出我们需要的数据和规则,构造糖尿病的分类和预测系统。 糖尿病的原始数据来源于对患者和随机人群的健康调查。健康调查表的内容经过适当的转换存入数据库作为原始数据。针对这些数据的不完整性、有噪声性和不一致性,本文用数据清理、数据变换、数据归约等数据挖掘的预处理技术处理这些原始数据。 本文数据挖掘的任务是从众多的糖尿病数据中挖掘出致病规律,为糖尿病的预防,诊断和预测构造决策系统。由挖掘任务的分类性和对挖掘算法的要求,本文选用了决策树方法来进行数据挖掘。同时,由于糖尿病数据的连续性,选用了决策树方法中的C4.5算法作为数据挖掘算法。 在实现C4.5算法的基础上,本文在糖尿病数据上进行了发病规律的学习和规则提取,在预处理过的糖尿病数据的基础上生成了一组糖尿病的诊断与预测规则。并用分类法的保持评判方法评判其正确率。 针对上述决策树对患病人群的正确率不够理想的情况,提出了以训练集的比例因子变量为参数,试验了患病人群的正确率和正确率均值随比例因子变量的变化关系,给出了一个经过改进的分类器和判定患病人群的解决方案。
其他文献
特别权力关系理论,产生于19世纪的德国。后传入日本,再由日本传入我国台湾地区。作为行政法学上一个内涵非常丰富的重要理论,传统特别权力关系理论的主要特点在于:排除法律保留原
随着汽车结构的不断轻量化和人们对汽车乘座舒适性要求的提高,使得汽车动力传动系的扭振问题越来越突出,成为汽车结构振动和噪声的主要根源之一。但长期以来研究人员对汽车传动
<正>传统招幌是中国传统工艺文化的代表之一,也是民间文化的组成部分。它从文化形式、文化语意、文化精神三方面折射出了深厚的传统文化意蕴,构成了极富民族特色的、典型的商
随着社会主义市场经济的不断创新和发展,企业并购活动在社会经济的各个行业广泛开展,并购已经成为社会经济生活中的特殊风景线。对于不同行业中的并购活动,由于行业各有特点,因而
资源配置问题是国有商业银行经营管理理论与实践中需要解决的核心问题。由长期计划经济体制脱胎而来的国有商业银行,资源配置的结构矛盾和资源配置的不协调是导致其质量不高和
本文共分三个部分,主要从法律角度对税务筹划作了初步的探讨和研究。本文着重解决的几个问题是:1.税务筹划的基础理论,包括其概念的法律界定、产生发展及研究状况、目标、作用、税
根据预应力混凝土自身的特点,比较全面的分析了影响预应力混凝土在施工过程中预应力损失的因素,并根据预应力损失原理提出减少损失应采取的措施,使得预应力的损失得到进一步
借壳上市是企业兼并收购的一种方式,同时也是一种上市捷径。它是伴随着证券市场产生、发展而产生、发展起来的一种高级形态的资本运营现象。在我国企业兼并收购市场上,非上市公
<正> 1986年8月27日,江阴南门要塞磨盘墩(位于应天河与九里河畔),即江阴县铁合金厂基建工地在平墩时发现一座古墓。此墓墓主为明南阳府同知承天秀。墓葬保存完好,出土了三十
期刊
针对国产大客车进行结构和动力学分析,并结合对客车中乘员相对侧倾运动的分析研究,在五自由度货车模型的基础上建立了六自由度、七自由度、九自由度、(5+n)自由度的客车操纵稳