【摘 要】
:
传统的包外估计记录全局数据与树之间的对应关系来测算泛化误差。然而基于MapReduce机制的并行随机森林算法(MR_RF)是建立在多个互不可见的分块数据上。对此分析MR_RF与RF的区
【机 构】
:
江南大学物联网技术应用教育部工程研究中心
【基金项目】
:
国家自然科学基金资助项目(61673193);中央高校基础研究资助项目(JUSRP51510,JUSRP51635B)
论文部分内容阅读
传统的包外估计记录全局数据与树之间的对应关系来测算泛化误差。然而基于MapReduce机制的并行随机森林算法(MR_RF)是建立在多个互不可见的分块数据上。对此分析MR_RF与RF的区别,设计了一个新的适用于MR_RF的包外泛化误差估计方法。主要将测算限定在数据块内,最终森林的泛化误差估计取块结果的平均。实验结果表明,新的包外估计方法与交叉验证在默认分块上的结果近似,却随着分块的增加出现偏差,对此分析了可能的原因,并给出选择集成方案思想,且分块大小与分类准确率成反比,与分类速率成正比。
其他文献
陶渊明少有壮志,也曾游宦多年。但是他对晋末官场的不适,前代隐者躬耕传统的感召,最终促使他解职归田,过上躬耕自足的生活。陶渊明的躬耕之路大体可分为耕仕徘徊期、安心躬耕
随着教育教学的改革以及向课堂要质量口号的提出,才使人们意识到要提高课堂的质量。根据多年的教学经验,总结出上好一堂课,教师要备好课、上好课以及充分利用现代教学手段等技巧
笔者在分析国内外产教融合模式现状的基础上,分析了订单班、现代学徒制与产教融合模式的关系,进一步创新性地提出了高职院校“311”产教融合模式的理念和框架:“3”代表产教融
为了研究不同形状轴向预制破片(球形、圆柱体、立方体)的飞散特性,在破片层等厚、单个破片等质量以及装药结构、装填条件、起爆方式相同的条件下,运用AUTODYN软件建立模型进
随着社会和时代的发展,我国农民也发生了重大的变化。传统的农民被人们认为是没有任何技术含量、出大力的人群,但当下我国农民在种植过程中不仅使用了先进的种植设备,还应用
目的:对四川省2002-2004年上报的762例抗菌药物不良反应(adverse drug reactions,ADRs)进行系统分析。方法:采用回顾性研究的方法。结果:发生ADRs以喹诺酮类最多(占34.78%)。给药途径以
<正>车型2017款奥迪A4L车(搭载CWN发动机)故障现象空调风口不出风。故障诊断连接故障检测仪(VAS6160A)读取故障代码,在08-空调/暖风电子装置内存储有故障代码"U107600本地数
为筛选适宜景泰灌区种植的马铃薯新品种,对7个马铃薯品种进行了比较试验。结果表明:大西洋、延薯4号、克新18号和兴佳2号产量高,综合性状表现好,生育期适中,建议在景泰灌区大
针对软件技术课程实践教学中存在的问题,提出基于强计算能力培养的全新实践教学模式,将课程的实践教学分为基本技能强化、应用技能提升和开拓创新3个阶段,并设计具体教学策略,强
利用Granger因果检验及协整关系考察香港股市与内地股市的联动关系。考虑到协整关系容易受外界冲击的干扰,将考察期间分为两个阶段:股改前和股改后。结果表明股改前香港股市与