CLIQUE网格聚类算法在医学空间数据中的应用

来源 :山西医科大学 | 被引量 : 2次 | 上传用户:liuhaoyingying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:糖尿病指的是由于身体机能失衡,所导致的以血糖高于正常值范围为主要表现的全身进行性疾病,其并发症多,患病率高,已经逐渐成为了影响世界各国的一个重要公共问题。根据国际糖尿病联盟(IDF)截止到2013年底的数据显示,2013年间,全球死于糖尿病相关疾病的人数超过了510万,达到了全年死亡人口的8.39%,全年的相关医疗花费达到了5480亿美元,占到了全部花费的11%,其中我国从进入21世纪以来,糖尿病人口数不断上升,到2013年底,已经成为了世界上患病人数最多的国家,达到了9840万人。所以如何运用统计学的方法对糖尿病数据进行分析,从而有效地预防该病的发生和发展,具有很好的现实意义。本文的研究主要有以下两个目的:第一将CLIQUE网格聚类算法运用到糖尿病患者的时空数据中并与基于划分(K-means算法)和基于密度(DBSCAN算法)的算法进行比较;第二对聚类结果中各个维度(如年龄、性别、生活习惯等方面)进行进一步分析,预防糖尿病的发生。方法:空间数据挖掘中的聚类分析是数据挖掘研究中一个重要领域,它既可以作为一个单独的工具发现数据库中隐藏分布的一些信息,也可以作为其他数据挖掘算法的预处理步骤。它主要目的是将数据集划分为若干个簇,使得簇内差异最小,簇间差异最大。在描述簇间的相似度大小时,主要是根据对象间的距离来确定的,距离越大,相似度越小,常用的距离有欧几里得距离和曼哈坦距离以及明考斯基距离。网格聚类技术是指把数据空间分成确定数目的网格单元来构建网格结构,然后再在得到的网格上进行聚类操作,与传统的聚类算法相比,基于网格的聚类算法具有更高的效率,且能够识别任意形状的簇,网格聚类分析现已被广泛的应用于模式识别、数据分析以及图像处理等领域。结果:得到了聚类时间以及内在外在方法的聚类精度方面的结果,通过对这些结果的分析可以得出以下的结论。结论:本文利用统计学上的三种聚类算法对美国130所医院10年间的糖尿病病人的相关数据进行实例分析,并对聚类结果在运算时间、结果的精确度方面进行了比较,通过比较可以发现无论是时间还是精度方面,结果最好的聚类算法是CLIQUE算法,其次为DBSCAN算法,最差的为K-means算法。
其他文献
试验介质用联合站或转油站油井采出液.破乳剂用联合站或转油站用于原油脱水生产使用的破乳剂.在联合站或转油站来液汇管取采出液样品装入带刻度的取样瓶中,读取样品总量和游
主要介绍了中原油田生产系统的腐蚀现状及采取的加药防腐技术和取得的效果与评价。这些技术主要包括注水井投加环空保护液,离子调整法处理油田污水、油井及集输干线端站投加缓
赵鼎新教授在《东周战争与儒法国家的诞生》中展示了春秋战国时代历史演变的社会学解读,传统与现代、国家与社会是贯穿全书始末的分析视角。本文在追溯作者学术视野和简介此
本文检测50例正常人,37例单纯慢性肺心病缓解期、急发期的左室收缩功能(STI)、泵血功能(ICG)。结果显示,单纯慢性肺心病缓解期、急发期的STI、ICG均异常。在正常组肺心病缓解
工业技术和经济之间有着密切的关系 ,设计的水平实质上是技术经济水平 ,分为安全性产品设计、使用性产品设计和经济性产品设计三个层次结构 ,提高产品设计水平的相关策略主要
《拙庵韵悟》是清康熙年间的一部音韵学著作,卷首“十要”一节,是本书的理论基础,有大量的音韵术语。赵氏用“十要”来统摄语音,“十要”包括:呼、应、吸、声、音、韵、经、纬、分
随着油田勘探与开发的不断深入,对测井资料的采集提出了更高的要求.以往的电法、声波、放射性等测井仪器,一般都是单支仪器下井,仪器的长度比较短,对材料及机械性能要求不是
本文分析了2010年6月19日二次汇改前后我国的汇率制度弹性、资本流动性和货币政策自主性的相对变化情况。研究结果表明,二次汇改后我国的汇率汇率制度弹性明显增强,资本流动性
温室气体的排放对全球气候及人类社会造成了极大的影响,其中CO2是对温室效应贡献最大的气体。燃煤火电厂是工业生产中最主要的CO2排放源之一,火电厂的碳减排成为缓解全球温室