【摘 要】
:
目的针对体检数据的高维度、高冗余特点,对体检数据进行Lasso特征选择,为高维体检数据减少数据冗余提供方法学参考。方法以代谢综合征为切入点,收集乌鲁木齐某体检中心2016年
【机 构】
:
新疆医科大学公共卫生学院; 新疆医科大学医学工程技术学院;
【基金项目】
:
国家自然科学基金(71663053);新疆科技支疆项目(2016E02082)
论文部分内容阅读
目的针对体检数据的高维度、高冗余特点,对体检数据进行Lasso特征选择,为高维体检数据减少数据冗余提供方法学参考。方法以代谢综合征为切入点,收集乌鲁木齐某体检中心2016年体检者信息共34 981例,每位体检者信息包含75个变量。Lasso算法用于筛选体检中与代谢综合征强相关的变量。以F值、几何均数、ROC曲线下面积作为评价指标,比较Lasso特征选择前后,决策树分类体检中的代谢综合征患者的性能。结果 Lasso特征选择后,体检变量降至34个与代谢综合征强先关的炎性因子。Lasso特征选择后,C4.5决策树的分类性能提高。结论建议在对体检高维数据分类前,运用Lasso进行特征选择,减少数据冗余,同时提高分类算法性能。
其他文献
2BSP500型全自动育苗穴盘分送机由穴盘分离装置和穴盘升降装置将成摞穴盘逐次单个分开,穴盘传送装置将单个穴盘输送到流水线上。简要介绍该机的主要结构特点及技术参数。
新课程实施以来,地理课堂发生了一定的变化。随着地理教材版本变得越来越丰富,学生合作探究的活动也变得越来越多,学生获取知识的渠道也变得越来越广,在这样的背景下,学生发
中国选择了市场经济,就选择了公平和平等。人与人之间如此,经济主体之间亦如此。而要做到这点,就必须实现经济法律制度的完善。本次全国人大常委会确定的立法计划,恰恰说明了中国
目的研究兔面神经爆炸伤的损伤情况及相关病理变化.方法选用点状爆炸源,距新西兰白兔面部2mm处引爆致伤.分别于伤后6小时、1天、3天、1周、2周取面神经,在光镜、电镜下观察神
目的:研究UF-100全自动尿沉渣分析仪检测异常红细胞的影响因素。方法:对UF-100全自动尿沉渣分析仪检测的420例异常红细胞尿液标本进行沉渣镜检。结果:112例假阳性标本分别为50例
将金融市场中期权的理念引入投资项目决策,产生了期权决策法及实物期权的概念,然而期权决策法在应用中也存在一些问题,其中的关键在于实物期权的定价.本文探讨了B-S模型用于
塔架的稳定是风机安全运行的基础。塔筒门段由于形状的特殊性,受力的不均匀,应力比较复杂,因而是塔筒校核中比较关键的环节。介绍了基于GL规范用Excel编程对塔筒门的结构进行校
针对润滑油对变速器免维护里程的影响进行研究。通过2台车辆10万km的行车试验,对试验过程中变速器润滑油定里程进行采样和化验分析,分析油品的粘度、酸值和铁含量等指标,判断
目的:观察冠心病(CHD)合并2型糖尿病(T2DM)患者载脂蛋白B100(ApoB100)基因突变的情况,并探讨冠心病合并2型糖尿病与载脂蛋白B100基因突变的相关性。方法:采用PCR与限制性内切酶MspI酶
某1.0L发动机在600h循环负荷耐久试验时,真空泵密封垫左下部位出现渗油现象,停机检查未发现异常,进行排查后,发现主要原因是真空泵轴承盖和缸盖之间存在台阶,影响了真空泵密封垫的