融合因子分析的随机森林研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:mn012love
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受特征重要性不平衡的影响,随机森林可能随机抽取到弱特征子集,从而生成"弱决策树",进而导致模型的收敛速度降低、模型的性能下降。鉴于此,提出融合因子分析的随机森林模型,主要创新在于采用因子分析法构建特征组,再按特征个数比随机抽取特征形成每个分裂节点的候选子集。以模型的分类预测、回归拟合、特征重要性分析的准确率和运行时间为评价指标,选取了9组UCI数据综合考察模型的整体性能,并与决策树、随机森林对比实验。结果表明:融合因子分析的随机森林模型基本消除了准确率低的决策树产生,提高了模型的准确率
其他文献
随着时代的进步和现代媒体的发展,在近几年的发展过程中,传媒在人们的生活中越来越成为不可分割的一部分。而在传媒当中,播音主持人是不可缺少的重要引导部分,作为电视传媒的
反常重积分的敛散性判别及其计算是数学分析中的一个难点,给出了类似于文献[1-2,7]中一个关于反常重积分收敛的充分性定理及完整证明,并在此基础上进行进一步推广,建立了反常
建立了连翘中连翘苷含量的高效液相色谱测定方法,该方法精密度、重复性良好,供试品溶液在12h内稳定,连翘苷回收率达到100.6%,该法可作为连翘的控制指标。同时对5个产地的连翘中连翘
自2012年9月11日起,全球领先的轴承、密封件、机电一体化、服务和润滑系统的供应商斯凯孚(SKF)在上海举办为期一周的系列活动,庆祝其在华经营100周年。9月12日,来自制浆造纸、
随着社会的发展,BIM技术应运而生,其发展速度也不断加快,但它的发展空间也非常大。因此,想要更好利用BIM技术来实现建筑行业更好更快的发展,就要不断对它进行完善,使BIM技术
汶川经过近三年的地震灾后恢复建设,其旅游业复兴取得了巨大成功。通过实地走访和调研,课题组总结出汶川灾后旅游振兴发展的"三高一统"模式,即高目标引导、高起点规划、高质量
目的:观察温阳化瘀汤联合葛酮通络胶囊治疗脑梗死恢复期对神经功能缺损(NIHSS)评分及生活质量的影响。方法:86例随机分为两组各43例,两组均用温阳化瘀汤治疗,实验组加用葛酮通络
后备猪选留分阶段进行且选留比例在10:1以上,只有保证一定的选择强度,才能达到真正实现后备种猪的优良水平。同时注意配种过程中的操作规范,提高配种受胎率。返情高也是影响全
本文结合海外援非抗击埃博拉疫情的工作实践,分别从救援特点、保障策略等方面,阐述了医疗卫生物资的筹备措施、配备等级和保障管理。通过理清工作性质、分析任务布局,提出了有效
<正>儿童和学生用品质量安全关系青少年儿童的身心健康,关系家庭幸福、社会和谐。近年来,在各级市场监管部门和社会各界的共同努力下,我国儿童和学生用品质量安全形势总体稳