数据挖掘技术在甲状腺疾病分类上的研究与应用

来源 :辽宁科技大学 | 被引量 : 1次 | 上传用户:chinababay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化医疗的快速发展,传统医疗方式暴露出了很多问题,如海量数据的浪费以及诊断处理不及时等,这些问题正在被逐步解决,现代医疗技术正不断给人们提供更高质量和更高效率的医疗服务。随着越来越多临床数据被存储在医疗数据库中,将数据挖掘技术应用于患者的疾病数据,挖掘出有价值的信息,将会为医疗决策和医学研究做出相当重要的贡献。近些年,研究者主要将数据挖掘技术应用于糖尿病,高血压以及心血管疾病等慢性病,很少将其应用在甲状腺疾病方向上,而甲状腺疾病是内分泌领域常见的高发病率疾病,也是除糖尿病以外的第二大内分泌疾病。因此,本文提出将数据挖掘技术中的关联规则挖掘算法与机器学习分类算法相结合的框架(AR-ANN和ARB),不仅可以从海量信息中挖掘出有价值的信息,为甲状腺疾病的预防和管控提供科学依据,还有效的对甲状腺疾病进行了分类诊断。本文设计并实现了甲状腺疾病数据挖掘系统,挖掘隐藏在实际甲状腺疾病临床数据背后的知识,为医生提供有力的诊断依据。框架应用UCI机器学习库中的二组真实甲状腺数据集进行实验分析,验证了所提出框架的有效性和正确性。首先,利用数据清洗,变换,集成等数据仓库技术对二组原始数据进行预处理。然后对处理后的数据进行多维可视化分析。接下来,采用两种关联规则挖掘算法(Apriori和Predictive Apriori),以甲状腺疾病的患病类别和健康类别作为关联规则挖掘中的后件约束条件,挖掘不同属性之间的相关规则,研究规则之间的相关性,为甲状腺疾病的临床研究提供有力的帮助。同时关联规则挖掘算法Apriori还将用于数据集的特征选择,对数据集进行降维。最后,将数据挖掘技术中的机器学习分类算法分成两大类别,人工神经网络算法(BP神经网络)和集成分类算法(Bagging分类算法),分别对甲状腺疾病进行分类诊断,并全面的分析与比较各个算法的性能。通过比较分析,获得了最适合甲状腺疾病辅助诊断的最优分类模型,同时也证明了本文提出的框架在甲状腺辅助诊断中的可行性和实用价值。
其他文献
本文主要考察顺从群作用下与整数群下遍历理论所展现出来的知识体系与结构.主要借助一些基础的遍历理论从整数群作用推广到顺从群作用的形式得以体现.第一部分介绍了整数群作用下的拓扑动力系统与遍历性质的一些基本概念与定义.具体给出了一些关于遍历理论以及庞加莱回复定理的相关定理与详细证明.第二部分在内容上是对应于第一部分关于整数群作用下的遍历理论等相关基本概念、定义与定理推广到顺从群作用下的动力系统中.具体包
任何司法诉讼活动都无法回避诉讼程序运行的问题。生态环境损害赔偿诉讼程序是诉讼目的与诉讼价值的重要体现。探索生态环境损害赔偿诉讼的程序运行,其核心在于理解政府的生
本实验室前期获得了灰葡萄孢致病基因BcPDR1,明确了该基因正调控病菌的生长、发育和致病力。为明确BcPDR1调控病菌致病力的分子机制,本研究利用PCR和Western blot技术,检测BcPDR1的编码功能;利用Pull down和酵母双杂交技术,对BcPDR1蛋白的互作蛋白进行了筛选与鉴定;利用数字基因表达谱、qRT-PCR技术以及酶活检测试剂盒,对受BcPDR1影响的过氧化物酶家族基因和胞
手性(chirality)是宇宙间的基本属性之一。手性化合物由相同的原子构成,但是对应异构体成镜像对称,看似一样,实则却不同。宇宙间的自然生物体在对手性这一基本特性的展现上也不尽相同,在生物体中的氨基酸基本上呈现出左旋,而核酸的呈现状态又与氨基酸是相反的。因此,手性对映体之间存在的差异是我们无法忽略的,一些不同对映体对于人体的影响可谓是天差地别在。环境中,也存在着手性污染物,这些物质可能存在的一些
加强野生动物监测有利于防止偷猎行为,全面贯彻禁止食用野生动物法律法规。无线多媒体传感器网络作为野生动物监测的主要方式之一,可以获取监测动物的图像信息,能够对物种多
伴随网络时代的到来,利用互联网参政、传播民主政治观念,变成当代大学生履行民主权力的关键途径。另外,大学生身为网络中不可或缺的群体,其网络参政对民主政治的进展具有极大
现有的动作迁移算法学习从骨架或三维模型到真实图像的映射,这意味着这些算法生成的结果受整体动作姿势,骨架位置和背景信息的影响。这种从“稀疏”到“稠密”的映射关系,不
在地理信息系统(Geographic Information System,GIS)中,瓦片地图服务是空间数据可视化过程中最基础与核心的地图服务模式。面对海量多源的空间数据,传统可视化方法难以兼顾
有色可溶性有机物(chromophoric dissolved organic matter,CDOM)是溶解性有机物的重要组成部分,探究CDOM时空变化规律及主要成分和来源可以为湖泊保护与管理提供支持。本文通过2017年和2018年的针对抚仙湖流域(湖泊、河流与沉降)的调查研究,得到了以下主要结果:2017年(1月至12月的逐月调查)抚仙湖湖体CDOM吸收系数a(254)平均值为3.47±0.5
随着全球定位系统的不断发展和移动设备的迅速普及,基于位置信息的空间数据呈爆炸式增长。与传统数据相比,空间数据表示的语义信息更加丰富,形式和性质也更为复杂,使得空间数据挖掘相较于传统的事务数据挖掘更富挑战性。为了从海量空间数据中发现有用的知识,从而对人类的生产生活加以指导,空间数据挖掘应运而生。空间co-location模式挖掘是空间数据挖掘中的一个分支,主要目的是挖掘在空间中具有并置(co-loc