一种基于聚类约简决策树的改进随机森林算法

来源 :南京邮电大学学报(自然科学版) | 被引量 : 0次 | 上传用户:mytony
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统随机森林算法为了提高分类准确率,常常需要构建大量的决策树模型。由于训练数据集的复杂性以及传统随机森林在构建过程中引入的随机性,算法在训练过程中会生成部分分类性能差和相似度较高的决策树,影响模型的整体分类性能。针对这个问题,提出一种基于决策树聚类的改进随机森林算法(Trees Clustering Random Forest,TCRF),从分类精度和相似性角度去除不合格的决策树,根据AUC值从原始森林中提取出相对高精度子森林,利用基于Kappa统计量的距离度量方法对子森林聚类,从划分出的簇中选取具有代表
其他文献
<正>城市基础设施是为城市人民提供生产和生活所必须的最基本的基础设施。包括交通、给水、排水、供电、燃气、供热、通信、环境卫生、防灾等各项工程,是城市建设的主体部分,
教材是教学之本,教材的质量直接影响到教学质量,但现存的经管类专业的会计学教材却存在定位欠准确、没有体现现行会计准则的理念、内容设计不能满足专业学习的需要以及内容设
期刊
本文分析了ACCA认证国际会计人才的供需特点,针对供需矛盾的焦点,从顺应地方需求、明确培养目标、优化教学体系和加强学生管理四个方面提出了解决对策。
工商管理类专业在全国各个民族院校均有开设,毕业生的就业率及就业质量近年来都呈下滑趋势。本文通过对中南民族大学最近五年毕业的工商管理类学生进行访谈和问卷调查,根据现存
<正> 城市定位是城市发展和竞争战略的核心,科学和鲜明的城市定位,可以正确指导政府活动,引导企业或居民活动,吸引外部资源和要素,最大限度地聚集资源,最优化地配置资源,最有
为研究44份楸树种质资源的遗传多样性及亲缘关系,利用AFLP分子标记技术,对采自鲁豫地区的44份楸树优良种质进行了分析。结果表明:筛选出的8对Pst I/Mse I引物组合从44份楸树
第28届中国新闻奖电视评论类一等奖获奖作品《减产为何却增收?》,从选题到采访、撰稿、编辑全流程突出一个"新"字,强化一个"正"字,新角度、新构思、新呈现,在接地气的形象诠
"项目化团队式"毕业设计模式是针对五年制高职的一种探讨,通过对实际生活中已经使用的项目,让学生让学生自己体验产品设计制作的全过程,最终完成1件达到项目功能要求的机电一
大豆作为全球最重要的油料作物,是中国进口的大宗农产品,对其种植区的精准识别是决策制定、种植结构调整基础,对国家粮食安全有重要意义。本文利用Sentinel-2作为数据源,利用