【摘 要】
:
选择逻辑回归(logistic regression)模型、支持向量机(support vector machine)模型以及XGBoost(extreme gradient boosting)三种模型,通过各公司前七年的数据对下一年是否会发生高送转进行预测.首先,求出日数据中每年的最后一个月即12月的日平均值,并将日数据、年数据和基础数据合并为总数据.通过观察法删除其中的无用特征,随后删除缺失比例达到0.7以上的数据行和特征,并使用平均值填充剩余特征的方法填充缺失值.对来自\'基础数据\'的\
【机 构】
:
湖北大学计算机与信息工程学院, 湖北武汉 430062;湖北省教育信息化工程研究中心, 湖北 武汉 430062
论文部分内容阅读
选择逻辑回归(logistic regression)模型、支持向量机(support vector machine)模型以及XGBoost(extreme gradient boosting)三种模型,通过各公司前七年的数据对下一年是否会发生高送转进行预测.首先,求出日数据中每年的最后一个月即12月的日平均值,并将日数据、年数据和基础数据合并为总数据.通过观察法删除其中的无用特征,随后删除缺失比例达到0.7以上的数据行和特征,并使用平均值填充剩余特征的方法填充缺失值.对来自\'基础数据\'的\'所属行业\'特征进行独热编码.随后使用Lasso回归处理共线性,并使用PCA(principal components analysis)对数据进行降维处理;使用标准差标准化的方法对数据进行标准化处理.数据清洗和预处理完成之后,使用逻辑回归、支持向量机、XGBoost三种模型,对股票下一年是否发生高送转进行预测,使用交叉验证指标分别对三种模型的预测结果进行评估.最后得出结论:对于大型投资商而言,使用XGBoost算法为股票投资进行决策支持是综合更优的选择;而对于中小型投资者来说,使用逻辑回归模型的预测结果是一种更保险的方式.
其他文献
随着生活水平的提高,锂离子电池在移动通讯、便携式工具、电动汽车等领域得到广泛的应用和发展.与此同时废旧锂离子电池所带来的环境和资源问题日渐凸显,废旧锂离子电池的回收再利用成为众多学者重点关注的问题.根据废旧钴酸锂电池的组成特点,结合实际情况,确定了电池放电处理、手工拆解、正负极分离、分离正极活性物质、柠檬酸双氧水体系浸出正极活性物质、沉淀分离金属钴的湿法工艺流程从废旧钴酸锂电池中回收有价金属钴.实验结果表明,在反应温度90℃,固液比20 g/L,摩尔比1:3.5,反应时间4 h,转速600 r/min,物
土壤组分信息监测是开展精准农业的基础,利用高光谱遥感技术获取土壤组分信息是当前的研究热点。结合实际生产应用,对土壤有机质、含水量、氮素、氧化铁、重金属五个主要方向的高光谱定量反演研究成果进行综述,归纳土壤高光谱数据获取方法、光谱处理方法、反演建模方法和模型应用效果评价等,总结土壤组分信息与光谱反射率之间的相互关系。基于土壤组分信息提取的土壤高光谱分析技术,可为土壤质量监测和精准农业生产提供技术支撑
肖家湾滑坡位于大宁河支流西溪河左岸,为特大型高位滑坡.为评估该滑坡与下游拟建水库之间的相互影响,对该滑坡的特征、形成机制等进行研究,对水库蓄水后的滑坡稳定性进行评价.研究表明,肖家湾滑坡可分为滑移区和变形区两个区块,为推移式滑坡,其形成主要受地形条件、地层岩性、构造作用及持续强降雨的影响;在正常蓄水位条件下,滑坡整体处于基本稳定状态,滑移区上部处于失稳临界状态,滑移区下部和变形区处于基本稳定状态,而强降雨工况下滑移区将整体失稳,变形区基本稳定;水库蓄水后,水位变化对滑坡产生的影响较小.该项研究可为滑坡监测
医疗服务是医院工作的核心内容,医疗的全流程化管理过程中,对信息化处理的要求变的越来越高.从以往传统的依靠纸质和手工的方式处理患者医疗信息,到以各类数字化诊疗技术为代表的智慧化诊疗手段、以医学为代表的现代医疗技术、以信息网络为代表的信息技术等现代化手段的发展形势已变得不相适应.医院信息化的发展历程由人财物的管理到临床业务的处理,由相对单一的医疗电子记录单发展到结合不同部门医疗数据的电子病历是发展过程中的必然路径.电子病历既代表着患者在整个就医过程中的活动和原始记录,也是医院信息系统的重要数据来源,所以电子病
采用等值反磁通瞬变电磁法对城市中一处岩溶发育区进行探测、数据处理以及三维成像展示,结果准确地反映出岩土界面、地下岩溶的位置、形态和规模,可为后期地质灾害防治提供可靠的基础资料,通过应用研究表明,等值反磁通瞬变电磁法可在城市浅表岩溶精细探测中发挥重要作用,符合未来城市精细化探测、立体化展示的发展趋势.
宣恩县地处鄂西武陵山区,境内地质遗迹资源丰富且类型齐全.通过县域地质旅游资源调查,初步查明46处重要地质遗迹景观,其中33处尚未被开发利用.对于零散分布的未利用地质遗迹景观,提出采取地质文化村和乡村旅游区两种模式开发乡村旅游.探讨乡村旅游开发过程中存在的主要问题,并提出相应的开发利用对策,可为宣恩县发展乡村旅游业提供思路.
降雨条件会显著改变滑坡的水文地质条件,在触发库岸凝灰岩滑坡过程中扮演着关键作用,但以往研究对降雨条件下,库岸凝灰岩滑坡体处于加速变形阶段的地下水时空分布特征关注较少.以邻近金温货线铁路特大型岩质库岸滑坡为例,对滑坡体不同部位的地下水水位与降雨量自动化监测数据进行统计分析,重点研究在库水位与降雨双重影响下,滑坡体不同部位的地下水时空分布动态特征与滑坡加速变形启动与停止之间的关系.总结出汛期与非汛期两种外部条件下,库岸滑坡内地下水水位时空分布特征,进而为下一阶段滑坡稳定性分析与灾害治理提供可靠的水文地质依据.
在全域旅游发展模式背景推动下,为了探索咸宁市旅游业深度发展过程中,如何进一步提升咸宁市旅游业发展质量,带动各县市旅游业整体发展,实现旅游业持续健康发展;本研究运用主成分分析法,选取主成分公因子,通过SPSS计算软件对咸宁市旅游业发展质量进行综合测度分析,研究结果表明:2010—2019年咸宁市的旅游业发展质量总体水平分为3个阶段的时序演变,总体呈上升-下降-上升的发展趋势,且2018年旅游业发展增长最为迅速.总体来说,旅游全域规划引导下,咸宁市旅游业发展质量进步明显;在旅游业深度发展过程中,可通过逐渐完善
合成了水溶性的2,6-二[1-(羟丙基)-1H-1,2,3-三唑-4-基]吡啶(PTD),研究了以N,N,N\',N\'-四辛基-3-氧杂戊二酰胺(TODGA)为萃取剂、正十二烷为稀释剂时,PTD对Am和Eu的反萃行为.研究了两相接触时间、PTD浓度、初始硝酸浓度和温度对Am和Eu分配比的影响.结果表明:Am与PTD形成1:1型和1:2型配合物,Eu与PTD形成1:1型配合物;PTD反萃TODGA-TBP中Am和Eu的反应均为吸热过程.在PTD浓度一定的情况下,反萃硝酸浓度小于0.7 mol/L时
采用物理力学性质试验,对大别山地区片麻岩风化带岩土体的强度特征进行研究.不同风化程度片麻岩的物理性质试验表明,随着风化程度的加深,片麻岩风化物内部孔隙体积逐渐增大,密度逐渐减小,越容易受到风化营力的影响;水理性质试验表明,随着风化程度的加深,片麻岩风化物的吸水率、饱水率及渗透系数均大幅增加;力学性质试验表明,随着风化程度的加深,片麻岩风化物各类力学参数均显著降低.在差异风化条件下将大别山地区片麻岩边坡局部变形破坏模式归纳为层内弧面滑动型、结构面直线滑动型、坡面流滑型、顺层滑移拉裂型、楔形体破坏型、倾倒破坏