基于大数据分析技术的2型糖尿病风险预测和聚类模型的建立

来源 :新疆医科大学 | 被引量 : 0次 | 上传用户:LQL12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:通过大数据分析技术分析乌鲁木齐成人血糖异常流行状况和血糖异常的危险因素,构建2型糖尿病(Type2 Diabetes Mellitus,T2DM)无创的风险预测模型和T2DM患者新亚型的聚类模型,实现T2DM的快速筛查及精准分类。达到从乌鲁木齐整体人群到T2DM的高危人群,再到T2DM患者的全程疾病管理的目的,为当地政府及医疗机构制定T2DM的防控和治疗提供参考依据。方法:1)以2018年乌鲁木齐全民健康体检的432,823名成人作为研究对象,分性别、年龄、民族和职业等情况了解该人群空腹血糖损害(impaired fasting glucose,IFG)和T2DM的患病率,分析与T2DM和IFG相关的危险因素;2)运用惩罚逻辑回归的LASSO(The Least Absolute Shrinkage and Selectionator operator)算法筛选变量,将变量纳入逻辑回归、决策树、随机森林、AdaBoost和XGBoost等五种有监督的机器学习方法中,建立T2DM的风险预测模型。使用混淆矩阵、准确率、灵敏度、特异度、精确率、召回率和ROC曲线下面积AUC等指标来评估五种模型的分类性能及优缺点;3)对32,030例成人T2DM患者的空腹血糖、高密度脂蛋白(High Density Lipoprotein Cholesterol,HDL-C)、低密度脂蛋白(Low Density Lipoprotein Cholesterol,LDL-C)、肌酐(Creatinine,Cr)、总胆固醇(Total Cholesterol,TC)、甘油三酯(Triglyceride,TG)、腰围、BMI、收缩压和舒张压等10个常规临床变量采用主成分分析(principal componentanalysis,PCA)方法进行数据降维和可视化,采用无监督的机器学习方法K-means建立了 T2DM患者的聚类模型,并通过total inertia和轮廓系数评价聚类模型的效果。结果:1)乌鲁木齐市成人T2DM的粗患病率(标准化率)为10.5%(8.25%),其中男性为10.8%(8.77%),女性为10.3%(7.69%)。IFG的患病率(标准化率)为7.0%(6.34%),其中男性为7.1%(6.51%),女性为7.0%(6.18%)。不同年龄、民族、职业、运动、吸烟、饮酒、饮食习惯、血压、心率、BMI、腰围和生化指标的T2DM和IFG患病率比较差异具有统计学意义;2)多因素logistic回归分析结果显示:年龄、民族(维吾尔族、哈萨克族、其他民族)相对汉族、男性、职业(农林牧渔水利业生产人员、生产运输设备操作人员及有关人员)相对商业服务人员、饮酒、缺乏运动、心率>100(次/分)、SBP、BMI、腰围、AST、HGB、Cr、ALT、TBIL、TG、TC、高血压、脂肪肝、贫血与IFG正相关;年龄、民族(维吾尔族)相对汉族、男性、职业(农林牧渔水利业生产人员、生产运输设备操作人员及有关人员、军人)相对商业服务人员、单次饮酒量(>25g)、心率过速、BMI、腰围、HGB、Cr、ALT、TG、BUN、冠心病、高血压、胆囊炎、胆结石、脂肪肝、贫血和动脉硬化与T2DM正相关;3)T2DM的风险预测模型:用LASSO从体格检查和生活方式调查变量中筛选出了年龄、性别、SBP、饮酒量(g)、运动状况、吸烟量(支)、心率、腰高比(WHtR)、脂肪肝和胆囊疾病等10个变量,构建了 5种T2DM的分类模型。比较5种模型发现分类性能由高到低依次是XGBoost(准确性=0.850,精确度=0.833,召回率=0.876,F-1=0.854,AUC=0.925)、AdaBoost、随机森林决策树和逻辑回归。T2DM的影响因素排名前三的依次是年龄、血压和心率;4)T2DM亚型聚类模型:聚类得到三个亚型①年龄性别相关性亚型(比例占49.8%):以女性和汉族为主,年龄偏大、贫血(10.8%,P<0.05)的患病率较高,而身体测量指数以及代谢综合征的患病率较其他组低;②肥胖相关性亚型(比例占35.4%):维吾尔族比例、身体测量指数以及代谢综合征的患病率较其他组高;③高血糖为特征型(比例占14.8%):以男性和汉族为主,心率、部分血脂指标和空腹血糖指数在三组中最高。聚类模型效果验证:K-means模型的轮廓系数是0.40,Total Inertia是688,说明聚类模型有较好的效果。结论:本研究首先分析得到新疆成人IFG和T2DM患病率高达7.0%和10.5%,存在性别、年龄、民族、职业、生活习惯等的差异。构建的5种T2DM筛查模型,模型的特点是成本低、准确、可重复,适用于流行病学分险高的地区的大规模人群糖尿病的筛查。最后得到T2DM的三种亚型,分析了每种亚型的特点。本研究的模型经过实践验证后,可为2型糖尿病的提早预防和个体化精准治疗提供理论依据。
其他文献
<正>文职人员知识结构能否适应军队院校向部队靠拢要求是实现强军目标的重要前提。通过对文职人员知识结构现状的分析,在阐明知识管理重大意义基础上,指出通过知识管理,可以完善教员队伍知识结构,并在知识管理的总体构建和具体内容和步骤实施上提出了自己的建议。一、军队院校文职人员知识结构现状分析非现役文职人员使军队院校知识结构更加多元化,也使教员队伍结构趋于合理。他们与现役教员相比,除了有超前新颖的教学理念和
期刊
既往我国高等医学院校均采用传统的教学方法,主要是教师讲、学生听,学生被动接收信息,大学本科生毕业后缺乏临床思维的锻炼,不能理论联系实际,无法运用书本知识已成为主要的教学难题。近年来,国内外医学院校先后都在进行医学教育模式的改革与探索,我院也完成以器官系统为中心的临床课程整合的改革,成立了消化系统整合课程学科,但在新的医学模式转变的基础上,如何采取更好的教学方式才能提高医学生临床思维能力和人文关怀意
期刊
第一部分经胸球囊肺动脉瓣成形术治疗婴幼儿重度肺动脉瓣狭窄的疗效分析研究背景肺动脉瓣狭窄(pulmonary valve stenosis,PVS)是临床上一种常见的先天性心脏病,部分重度PVS的患儿出生后在新生儿期就会出现紫绀,严重低氧血症及合并心功能衰竭,这部分患儿必需紧急外科治疗才能有存活的机会。部分未及时给予手术干预的患儿会造成严重的右心结构的改变和右室功能的下降,影响患儿远期治疗效果和生存
学位
第一部分 血小板生成素受体激动剂调控ITP患者MDSCs免疫功能的机制探究研究背景:原发免疫性血小板减少症(primary immune thrombocytopenia,ITP)是一种获得性自身免疫性疾病,是继化疗引起的血小板减少之后最常见的获得性血小板减少症。ITP以孤立性血小板减少和不同程度的出血症状为临床特征,严重者危及生命。免疫失耐受导致的血小板破坏增多和生成减少是其主要发病机制。目前,
学位
相较于交流电网和常规直流输电系统,柔性直流电网具有有功功率和无功功率独立控制、能够为无源网络供电、潮流翻转不需要改变电压极性等优点,是大规模新能源接入的优选方案,也是未来新型电力系统的重要组成部分,对于实现我国“碳达峰碳中和”的发展目标具有重要意义。但是,柔性直流电网中换流器的电压源特性导致其在直流线路发生短路故障后,故障发展速度极快,故障电流在数毫秒内即可达到数倍甚至数十倍的额定电流,严重危害电
学位
溃疡性结肠炎(Ulcerative colitis,UC)是一种常见的消化系统疾病,其主要特征是血便、腹痛和体重减轻,患者常伴有焦虑抑郁等精神症状,而其病因至今仍不清楚。有研究发现,在UC患者循环系统中发现了升高的2型免疫细胞因子(如IL-13),表明2型免疫是参与UC发病的重要因素。临床上治疗UC有多种药物选择,但是多数存在明显的毒副作用,并且单抗类药物并不适用于所有患者,目前寻找安全有效的治疗
学位
目的:从学生角度对"3+1+1"早临床基地教学的效果进行探讨开展"早临床"教学的必要性及改进措施。方法:以成都中医药大学医学与生命科学学院临床医学专业2015级60人和2016级453人学生为对象进行调研研究,通过文献调查法、问卷调查法、对比分析法进行研究。结果:成都中医药大学医学与生命科学学院临床医学专业已全面开展"3+1+1"早临床基地教学,从目前学生角度反馈来看"3+1+1"早临床基地教学开
期刊
报纸
目的:探讨临床医生与基础教师联席授课的生理学案例教学法在医学生“早临床”实践中的意义。方法:以2019级麻醉班和法医班为观察组,2019级影像医学和精神医学班为对照组,在二年级上学期由临床医生和基础教师联席授课,采用翻转课堂模式进行生理学案例教学尝试,通过问卷调查评价教学效果。结果:绝大部分观察组学生认为在医学基础课程学习阶段就较早地采用此种由临床医生亲自指导去接触临床案例的教学方法,可以加强对理
期刊
极值点偏移问题综合性强,常令学生望而生畏.构造函数是该类问题求解的重要方法但不易掌握.基于任何方法总有其思维起点或认知基础,本文通过具体问题的解法分析探究构造函数中的对称差构造法、比值法、消参法、主元法等思路,体会基于规则的想象是数学的思维法则.
期刊