【摘 要】
:
随机森林(RF)是一种统计学习理论,它是利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测
【机 构】
:
厦门大学经济学院计划统计系,厦门大学数据挖掘研究中心
【基金项目】
:
中央高校基本科研业务费专项资金《基于数据挖掘的数据质量管理研究》(2010221040);国家统计局重点项目《金融风险中的统计方法》(2009LZ045)
论文部分内容阅读
随机森林(RF)是一种统计学习理论,它是利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测结果。它具有很高的预测准确率,对异常值和噪声具有很好的容忍度,且不容易出现过拟合,在医学、生物信息、管理学等领域有着广泛的应用。为此,介绍了随机森林原理及其有关性质,讨论其最新的发展情况以及一些重要的应用领域。
其他文献
传统的浓香型白酒生产是以泥窖为发酵载体,窖池中的酒醅在一定的条件下经过各种微生物以及酶的作用,进行复杂的能量代谢,最终将淀粉类大分子物质转化为酒精和各种香味物质,形
加入WTO以来,我国农产品对外贸易得到了长足发展,是世界农产品贸易增长速度最快的国家之一,成为了世界农产品贸易的大国,但是我国农产品贸易极易受到环境的影响,并不是贸易强
文章以上海证券市场上机械、设备、仪表板块类A股公司的存货发出计价方法、折旧方法、短期投资跌价准备、存货跌价准备和长期投资减值准备方法的选择为例,从契约理论的角度,
文章利用2003-2012年江苏省统计数据资料,构建以进出口贸易、外商直接投资、国际经济合作与国际旅游为核心的评价指标体系,使用熵值赋权法对江苏省经济对外开放度进行了测算
创新创业教育成为中国高等教育理论研究和实践研究的双热点,被视为21世纪的“第三本教育护照”,创新创业教育是建设创新型国家、提高教育教学质量、缓解就业压力的客观需要。
经过改革开放近四十年的经济快速增长,中国已经超越日本,成为世界第二大经济体。经济的高速发展也带动了我国旅游业的进步,尤其是最近几年,旅游业显然已经成为我国国民经济新
[目的]病与证的结合乃是现代中医临床的主要医学形式,“审证求机”是中医辨证论治过程中主要环节。深入了解银屑病的病证特点及其理、法、方、药,可以更好的进行临床指导,从
<正>罗克韦尔自动化为延长气田的数字化建设提供了全方位SCADA系统解决方案,从井口数字采集系统RTU自动上传井口信息;集气站的PCS控制系统和SIS仪表安全控制系统先进的、开放
目的探讨气囊仿生助产术在缩短产程、降低剖宫产率、提高阴道自然分娩产率的应用价值。方法将2011年7月至2013年12月在该院分娩的初产妇随机分为观察组(393例)和对照组(523例