改进K-MEANS算法及在I型糖尿病血糖值的聚类应用

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:ysy8023zq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在以前的研究中,更多的数据挖掘的算法应用于Ⅱ型糖尿病中。这个研究的目标是设计和实现一个数据挖掘的算法,帮助医生更好的诊断和分析Ⅰ型糖尿病病人的病情。为了完成这个目标,首先是收集记录Ⅰ型糖尿病人的血糖值。然后是学习了解主流的数据挖掘算法,通过阅读文献比较这些算法。最初选取的是K-means算法应用到Ⅰ型糖尿病中去聚类病人的血糖值。然而,K-means算法有三个主要的缺点。第一,K-means算法的执行结果非常的依赖于数据输入的顺序。第二,K-means算法对孤立点非常敏感,并且会降低聚类的准确率。第三,很难对落在重叠区域的数据样本很好的聚类。因此,使用分层分类的方法解决第一个问题,使输出的结果不依赖于数据属于的顺序。使用分层抽样的方法解决第二个问题,将孤立点从数据集中分离,避免孤立点对聚类结果的影响。提出使用模糊逻辑和K-means算法相结合解决第三个缺点,使得落在重叠区域的数据样本不会丢失转变信息。对于解决每个缺点的方法,都用实验验证了算法的可行性。
其他文献
期刊
目的 探究小鼠气道平滑肌细胞表达与分泌白细胞介素(IL)-33参与哮喘的信号机制.方法 观察不同浓度[0 ng/mL(空白)、1 ng/mL、10 ng/mL、100 ng/mL]TGF-β1组对小鼠气道平滑肌
本文针对贵州地区广泛分布的浅变质岩基本特点,开展浅变质岩风化层边坡稳定性评价方法、破坏机理和破坏模式研究。   论文首先对贵州省典型浅变质岩风化层边坡地层岩性、
审视当前作文教学的现状,初中生无法演绎真实情境的写作,无法进入畅适自然的写作状态,更无法提高自己的写作能力.因此,寻绎实现真实情境写作的中考命题,从情绪、思想与内容的
目的 探讨血清抗苗勒管激素(AMH)与育龄期女性自然妊娠能力的关联性.方法 收集2016年1月至2018年5月在山东大学附属生殖医院进行健康查体的601例育龄期女性的临床资料.将受试
目的 探究轻度脑白质疏松症(LA)患者认知能力及大脑中动脉搏动指数(PI)的相关性.方法 收集2019年4~10月就诊患者,将46名轻度侧脑室旁LA且受教育程度大致相同的患者组成研究组,
目的 探讨核糖体蛋白S6激酶2(S6K2)沉默在乙醇诱导的心肌胰岛素抵抗中的作用.方法 采用荧光标记2-脱氧葡萄糖(2-NDBG)摄取实验及葡萄糖氧化酶法检测在100 mmol乙醇刺激下,沉
暗挖法地铁隧道施工引起的地表沉降问题是地铁隧道建设中人们尤为关注的问题,也是在工程中亟待解决的关键性问题之一。地表沉降被普遍认为是由于地层损失引起的,暗挖法地铁隧道
在生物医学领域,微小颗粒悬浮液常用来模拟生物组织。研究微小颗粒悬浮液对光的单次散射特性和漫散射特性对获悉颗粒特征和光在介质中传输规律具有重要意义。在通常的单次散射
在生物组织成像过程中,光学相干层析术(Optical Coherence Tomography, OCT)具有非侵入、高分辨、活体检测等优势。近年来,频域光学相干层析系统(Spectral Domain Optical Coheren