基于随机森林算法的两阶段变量选择研究

来源 :系统科学与数学 | 被引量 : 0次 | 上传用户:dej0415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变量选择在高维数据处理中尤为重要,其中变量的重要性评级是关键问题.文章提出基于随机森林两阶段逐步变量选择算法.第一阶段提出变量重要性排序改进方法,目的进一步提高重要变量与噪声变量的区分度.第二阶段基于随机森林的逐步变量选择.通过模拟数据验证该方法的有效性和可行性.对水稻数据QTL定位进行实证研究,将基于两阶段随机森林逐步变量选择算法与SCAD、Elastic Net、传统QTL定位WinQTLcart2.5软件的运行结果比较,发现基于随机森林两阶段逐步变量选择算法能有效筛选变量.
其他文献
长期以来,由国家财政部门直接拨款的国有资金一直作为我国国有企业的基础资金存在,支持着国家国有企业的正常经营与运行。随着全球经济一体化进程的加快,虽然我国国有企业经
中华人民共和国合同法规定,因胁迫而订立的合同是无效或可变更、可撤销合同。但对胁迫的构成要件没有规定,学界也鲜有论及。胁迫的要件宜从以下几个方面确定:一是胁迫的主体,
电子商务代表未来商务交易的主要趋势,电子商务网站是企业开展电子商务的重要阵地。本文分析了电子商务网站设计的原则,从总体上对电子商务网站建设的目的确定、客户定位、功
<正>2019年3月18日,习近平总书记主持召开学校思想政治理论课(以下简称思政课)教师座谈会,并作重要讲话。习近平总书记在座谈会现场提到了思政课教师队伍建设的当前现状,指出
介绍国外新型轻质复合材料在炮管及火炮其它零部件上的应用研究与发展状况,并指出了火炮材料的发展趋势。
现阶段无论是国内还是国外的在线COD监测设备均是放置在水源后端的大型设备,无法做到真正的实时在线监测COD,并且设备沉重,不便于携带和移动,基于紫外吸收原理的在线COD数字变送
废弃医疗仪器设备由于其高附加值和污染性,最终会造成一定的社会影响,通过对其实施逆向物流可实现节约资源和保护环境的目的。随着逆向物流的实施,相关处理企业将会面临设备回收
全国城镇污水处理及再生利用设施“十二”建设规划中指出“全面提升污水处理能力,加快污水处理厂升级改造,进一步提高污水厂的脱氮除磷功能”。因此,脱氮除磷仍是我国污水处理工
随着国家的发展,对涉密人员进行规范管理是对国家秘密安全性的重要保障。以现在的发展情况来说,我们国家对涉密人员的管理方面还存在着一些不足之处,主要体现在缺乏担当意识
随着李克强总理提出"互联网+"的概念后,万物互联的趋势已经日渐初显,"互联网+"以井喷的速度发展并渗透到社会经济、文化、生活的各个方面。随着我国会展业的持续稳定发展、产