不平衡数据的关键因素筛选方法

来源 :世界科学技术-中医药现代化 | 被引量 : 0次 | 上传用户:fengfeiyuren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据不平衡问题的存在,使得模型倾向于将测试样本判别为多数类,导致少数类的分类效果较差。可以从数据和算法两个角度解决数据不平衡带来的问题,本研究主要关注关键因素筛选时不平衡问题的处理,在数据层面使用基于SMOTE抽样的Group Lasso,算法层面使用了调节阈值的Group Lasso,包括分步调节参数和同时调节参数两种方法。最后在307例亚健康患者的问卷数据上使用三种方法建立"肝郁脾虚"诊断模型。从得到的结果来看,基于SMOTE的方法和同时调参的方法得到模型预测效果在灵敏度和特异度上
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
[目的]通过热重分析研究椰子油的氧化稳定性及动力学.[方法]分别在不同气氛(空气、氮气)和不同升温速率(2、5、10、20、25、40 ℃/min)下对椰子油进行氧化稳定性分析和动力学分析
为解决2205顺槽围岩变形量较大等问题,通过对比本矿其他工作面以及相似矿井的支护方案提出了相应的支护方案,采用理论计算的方法对采用工程类比提出的方案进行了验算,通过采
阐述农作物新品种DUS测试重要性、迫切性,分析福建DUS测试存在问题,提出推进DUS测试的措施,包括加强监管和指导、增设DUS机构编制和政府购买服务、共享测试结果、新技术应用
目的观察鬼毛针多糖对正常小鼠免疫功能的影响。方法小鼠腹腔注射不同剂量的鬼毛针多糖(5,10,20mg·kg^-1·d^-1),对照组给予等量生理盐水,每天给药1次,连续14d后,用血细胞计
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
通过对教师课堂教学质量评估实例,指出了模糊数学评估模型在评估中的应用以及这种评估办法在实际评估中的现实意义.
不孕症是指女性无避孕性生活12个月而未孕[1]。女性不孕症常见的病因包括输卵管因素、排卵障碍、内分泌因素、子宫内膜异位症、年龄因素及染色体异常等,其中,以输卵管性不孕
随着人们生活水平的提高,拥有健康的身体越来越受到重视。通过定期的健康体检,可以了解目前机关干部中患病率高的疾病及趋势,以便及早采取有效预防和治疗措施,减少疾病的危害。本
针对履带拖拉机使用过程中的常见问题,对履带拖拉机转向离合器主要部件的检修技术要点做了重点阐述,以提高拖拉机维修质量,保证维修后的可靠使用。