【摘 要】
:
近些年来,随着人们生活水平的提高,食物越来越多样化,患糖尿病的人数也越来越多,糖尿病逐渐成为影响人类健康的主要因素之一,而妊娠期糖尿病是其中特殊的一种。孕妇患妊娠期糖尿病之后对胎儿和自身的影响都很大,甚至危及到生命,因此对妊娠期糖尿病的早期筛查非常重要。目前,机器学习的发展越来越成熟,很多领域都会结合机器学习模型解决相关问题,并取得了显著的成果。因此,可以将机器学习模型应用在妊娠期糖尿病的预测上,
论文部分内容阅读
近些年来,随着人们生活水平的提高,食物越来越多样化,患糖尿病的人数也越来越多,糖尿病逐渐成为影响人类健康的主要因素之一,而妊娠期糖尿病是其中特殊的一种。孕妇患妊娠期糖尿病之后对胎儿和自身的影响都很大,甚至危及到生命,因此对妊娠期糖尿病的早期筛查非常重要。目前,机器学习的发展越来越成熟,很多领域都会结合机器学习模型解决相关问题,并取得了显著的成果。因此,可以将机器学习模型应用在妊娠期糖尿病的预测上,进行早期的筛查,做到早发现早治疗。本文在阿里云和青梧桐基因联合举办的天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测提供的妊娠期糖尿病数据集上,通过构建不同的机器学习模型并进行分析评估,得到表现最优的模型。具体的研究内容为:(1)选择算法。在阅读关于妊娠期糖尿病的相关资料后,结合数据集的特点,经过初步探索后选择了逻辑回归、支持向量机、XGBoost和Cat Boost这4种算法来建模。(2)实验数据预处理。原始数据集有很多缺失值,并且存在异常值,数据之间的量级差别很大,因此对原始数据中的离散特征,用“Null”填充空缺值;对连续特征中的空缺值,采用均值填充;对连续特征的异常值,采用中位数替换。之后对离散变量进行one-hot编码,并对连续变量做归一化处理。(3)选择预测模型的特征。数据集中的特征很多,存在冗余字段,这些冗余的特征会带来运算负担。因此本文在数据预处理后使用SVM-REFCV算法做特征选择,最终筛选出了47个特征代入后续的机器学习模型中。(4)建模并评估。将经过数据预处理和特征选择之后的数据集以8:2的比例分成训练集和测试集,使用(1)中的4种算法分别建模,并使用网格搜索与交叉验证结合的方式进行调参,确定了最优参数后,分析模型的各项指标。然后提出投票法、Blending和Stacking三种模型融合方法,将前四个模型进行不同方式的融合。本文使用f1值和AUC值对所有模型进行评估,实验结果表明以逻辑回归、Cat Boost、支持向量机和XGBoost作为初级学习器,Cat Boost作为次级学习器的Stacking方法表现比其他模型都好。因此Stacking方法在妊娠期糖尿病风险预测上效果最好。
其他文献
青鱼(Mylopharyngodon Piceus)作为我国主要的经济养殖鱼类,受到了广大消费者的喜爱。但由于鱼油产量降低,价格升高等原因,水产行业普遍存在以其他脂肪源替代鱼油的现象。而以其他脂肪源替代鱼油后,鱼肉普遍存在营养价值降低、质地变差、土腥味明显等品质下降的现象。本研究初步探讨不同脂肪源对青鱼肌肉品质的影响,寻找合适的脂肪源用以替代鱼油,为后续研究提供理论基础。本试验以鱼油(FO)、猪油
在我国经济社会发展过程中,国有企业一直承担着重要角色。自改革开放至今,我国在不断推动国有企业混合所有制改革。自十八大以来,国企混改进入了新的发展阶段。而近几年国企改革三年行动的推出,也标志着我国国有企业混合所有制改革进入了关键阶段。在众多的混合所有制改革方式中,引入战略投资者这一混改方式一直在国企混改中广泛应用,其不仅能够实现各个企业之间的资源共享,也可以形成新的战略布局,产生战略协同效应。本文通
目的:利用数据挖掘技术分析治疗月经病中医无名方的组方用药规律。方法:收集整理治疗月经病的无名方,使用中医传承辅助平台(V2.5),采用频次挖掘、关联规则挖掘、基于无监督的熵层次聚类等方法进行用药规律挖掘。结果:分析无名方 484首,药性以寒(35.77%)、温(32.75%)、平(25.85%)为主,药味以苦(35.44%)、甘(27.12%)、辛(22.35%)为主,归经以肝经(30.55%)、
锂金属具有~3860 m Ah g-1的超高比容量和-3.04V的超低氧化还原电位,被认为是在先进电池领域最有前途的负极材料之一。然而锂金属负极在应用的过程当中有诸多的问题,如枝晶、死锂、电极的体积膨胀、粉化等等,这些都严重地阻碍了它的实际应用。本文以锂枝晶的影响因素作为研究的基础,考虑电极的体积膨胀、锂离子的分布、锂金属的沉积和剥离等多方面的因素,设计有效的锂金属负极骨架来抑制锂枝晶的生长,缓解
皖南古村落是中国传统建筑群中具有典型地方文化特征的古村落,是徽文化的重要物化体现,也是中国传统文化中的符号和标志,它融合了多种艺术领域的文化内涵以及独特的民族化造型语言,反映了无与伦比的艺术魅力。本文以油画为载体,将中国传统文化中徽文化的造型元素应用于油画创作中,探寻一种新颖和传统相结合、民族特色与历史美感相融合的表现形式来继承和发扬中国传统文化,贯彻落实文化自信。运用油画创作形式弘扬皖南古村落的
国有企业作为国民经济的支柱,在促进我国的经济发展中发挥着重要作用,但国有企业在治理机制、运营效率等方面的问题一直对其发展产生负面影响。随着我国经济发展进入新常态,国有企业面临日益高效和高质的发展要求,进一步推动国有企业改革,解决其发展中的沉疴积弊,使其担负起新常态下缓解经济增速下滑、促进经济增长的使命,成为当前我国经济改革的重要任务。2013年十八届三中全会把发展混合所有制经济提升到新的高度,为当
科技革命是当今世界没有硝烟的战争主战场,而显示面板行业作为一个战略性新兴产业,科技引领和产业联动效应较强,在一国经济中具有重要的作用。然而,受疫情危机和国际贸易摩擦的影响,显示面板制造业面临极大的挑战,比如全球供应链的紧张、技术保护和封锁等等,这些问题和挑战阻碍了显示面板企业的可持续发展,影响了企业战略推进和财务绩效提升,对企业资源配置和重整提出了更高的要求。而京东方作为行业的龙头,其所面临的问题
现实中许多的多属性群决策问题涉及到多种异质的评价属性,单一的信息形式不能灵活、准确的表达定量和定性多种属性的评价,保留多种信息形式有利于信息表达的完整性和决策结果的可靠性。因此,混合信息多属性群决策十分具有研究价值。本文在实数、区间数、直觉模糊数和语言Z数组成的混合信息评价环境下,对基于共识模型的混合信息多属性群决策方法展开研究。具体研究内容主要包括以下几个方面:(1)混合信息基础理论研究。将实数
我国居民的对熟肉食品的消费逐步增加,但是部分散装熟肉食品保质期较短,易腐败变质,极易影响熟食企业形象。为了企业的健康发展,连锁熟食企业需要加大对熟食在物流运输中的关注,其中熟食配送环节对于控制企业成本,保证熟食质量至关重要。本文在相关理论研究的基础上,调研分析了J熟食公司的相关情况。济南J熟食公司的产品由分公司自己生产、配送与销售,同时配送中心与配送车队企业自营。公司为部分商超配送包装熟食产品,配
美国发起的对华贸易战中限制了对华芯片的出口,中国中兴通讯在内的多家实体企业被美国列入出口管制清单,全球各大芯片供应商也相继宣布不再为华为供货或提供代工服务,中国相关企业被迫从依赖进口向自主研发转型。以上无不表明中国缺“芯”少魂的现状,作为现代工业的“食粮”,芯片被广泛应用于众多新兴领域,离开芯片产业的支撑,智能终端的发展将无从谈起。而中国芯片技术长期受制于人,如今正面临着“卡脖子”的困境。要想突破