数据挖掘在甲状腺功能减退症分类中的应用与研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:cf1987821
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗信息化的发展,诊断数据量的激增,需要结合数据挖掘技术进行深入分析,提取有潜在意义的知识。当前基于甲状腺功能减退症(简称甲减)的分类挖掘研究较少,只是纯粹地从医疗分析的角度,统计学原理的角度,单一数据挖掘模型的角度出发,未能将统计方法与数据挖掘技术有机结合,也未能将数据挖掘的多种模型进行综合性地比较分析,以此决定甲减分类模型的优劣。本文针对甲减分类在以上研究领域的不足,挖掘甲减的不同测量数据,从统计原理的方法和实际应用两方面对多种分类模型进行了较为深入的研究。从变量要求、数据鲁棒性、时间运行、结果解释、分类准确率和性能伸缩性等多因素,综合研究了三类模型的性能优劣,对临床甲减分类诊断具有一定的参考作用和指导意义。本文所做的主要工作有:1)阐述了数据挖掘技术的相关概念和主要应用领域,较为深入地分析了数据挖掘过程CRISP-DM中的各个实施阶段,及其产生的相应结果。结合研究与应用,对甲减分类进行较为透彻的业务理解。同时在数据理解过程中,进行了甲减属性的深入探索,使训练集和测试集的选择具备一般性。在数据准备方面,针对相关变量字段存在的缺失值,离群值,无用属性或冗余属性等情况,进行了较为全面的数据分析和数据预处理工作。2)基于数据模型的统计学原理,本文着重探讨了统计方法与数据挖掘的异同之处和相互关系,主要研究了判别式分析算法,Logistic回归算法和CHAID决策树算法的数学原理及应用。通过建立相应的数据挖掘模型,得出了甲减分类的主要判别指标。以统计原理的方法与多种数据挖掘模型相结合的方式,进行了较为全面的数据统计分析和挖掘算法研究,找到较优的挖掘模型,并进一步将三种模型从不同测量因素上进行综合分析与比较。3)在Clementine12.0开发环境下,采用了CRISP-DM数据挖掘标准过程进行系统性的甲减挖掘研究与开发,从总体上和细节上有机地把握挖掘实施过程的六个阶段,以一种结构化的、体系化的、标准化的、可视化的流程进行数据挖掘工作。利用Script脚本语言开发数据挖掘的整个过程,从而改善了那些手动的、重复的、耗时的工作任务,有利于在操作界面上实现过程的自动化和处理对象的批量化。
其他文献
无线传感器网络集中了微机电、感知、嵌入式计算、分布式信息处理和无线通信等技术,形成了一种全新的信息获取和处理模式。布局、覆盖、节点定位、网络通信协议是传感器网络
RIP协议是基于距离向量的路由协议,由于其操作简便,系统资源消耗小,适合应用于小型网络。RIPng是基于IPv6的RIP路由协议。为了保证网络中运行RIPng的路由器能够正确互联互通
移动自助服务系统通过有线或无线网络实现了对其自助服务终端的远程监视和控制,方便公司内部管理,并且为用户提供了方便的途径完成缴费和其他基础业务。由于系统的复杂性,对
“数字油田”源于1998年前美国前副总统戈尔提出的“数字地球”的概念,旨在最大程度地实现信息共享,为勘探开发、经营管理以及科学决策等提供强有力的信息技术支持,从而满足
与传统网络不同,无线传感器网络通常部署在野外或者敌方区域,其网络节点成本低廉、结构较为松散、不具备抗篡改能力、且容易被攻击者俘获,无线传感网络的安全问题已经成为制
随着中国网民数量的不断增长,论坛、博客、微博等网络媒体作为民意表达最为集中、信息传播最为畅通的一个“场所”,越来越受到网民的热衷。网络舆情检测与控制涉及到的关键技
传感器网络是由一组传感器以自组织方式构成的网络,其目的是协作地感知、采集和处理网络覆盖的地理区域中感知对象的信息,并发布给观察者。传感器网络的应用前景非常广泛,主
图像的呈现,是指图像内容的组织、变换与展示。良好的图像呈现形式有助于信息的展示、气氛的渲染和情绪的表达。面向不同的问题,一些图像呈现技术,例如拼贴图(Collage)、镶嵌
大幅面专业扫描仪有着广阔的市场前景与研究价值,利用各种手段实现其高性能、高质量扫描一直是追求的目标。本文结合传统多CCD结构的研究经验与实现方案,设计了一种基于嵌入
膜生物反应器(Membrane Bioreactor,MBR)是将膜分离技术与生物技术相结合并应用于污水处理领域的一项新兴技术。大量研究表明,MBR的能耗问题主要是由膜污染问题造成的。因此,研