GINI指数相关论文
数据预处理包含相关性分析、数据清理和数据归约三个子模块.相关性分析子模块通过计算类别属性和非类别属性问的相关性,剔除与分类......
工业品的生产与销售是现实生活中必不可少的重要因素,已经影响到社会的各个方面,也在社会众多领域中扮演着重要的角色。目前阶段工......
针对原始销售数据存在大量重复样本和冗余属性,影响烟厂预测的精度和速度这一问题,提出了一种基于GINI指数的C4.5优化算法.运用决......
决策树是数据挖掘中非常重要的一种技术,常用来做数据分析和预测。传统的决策树算法在处理海量数据挖掘时,受到CPU和内存的限制,导......
在介绍了现有数值型属性分裂方法的基础上,引出了纯区间的概念,提出了一种基于纯区间归约的数值型属性分裂方法。该方法将属性值域用......
中国制造业有3项世界冠军:高铁、光通信、超级计算机。2012-2016中国倡议"一带一路,互联互通"规划与建设,将推进中国"智能制造"的第4项......
文中提出了一种基于嵌入式系统CPU功耗预测并对其进行低功耗优化的方法.引入GINI指数的构建训练分类器,利用PowerTop工具对系统CPU......
引出了纯区间的概念后,提出了一种基于纯区间归约的数值型属性处理方法对SPRINT算法进行改进。该方法将属性值域用等宽直方图的方法......
信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融......
在犯罪时间分析中,时段分析由于颗粒度较小,容易受到犯罪时间模糊性的影响。以某市的入室盗窃案件为样本,从报案时间和时段概率两......
为了更好地选育乌冈栎种苗,以种子长度、宽度和重量做为种子性状的指标,对福建茫荡山乌冈栎天然种群的23株成年个体进行了2年的野......
信息与数据的膨胀导致了描述数据的属性急剧增多,而数据量也呈爆炸式增长。海量的数据不仅使传统的数据挖掘算法建模时间过长,而且冗......
当前网络语料会不断出现大量新词已经成为一种普遍的趋势,这里面包含大量网友创造的新词,以及一些社会热点形成的新词。同时社交网......
主要利用基尼指数、希尔指数、变异指数等指标对海南省的土地利用集中度的区域格局、区域差异的来源及构成,区域收敛的可能性与收......
在大陆青冈分布区东缘的大金山岛种群中按不同坡向取样,旨在揭示相对均一条件下青冈种子的形态变异及变异的来源,以从不同侧面研究......
采用开放应用架构(OAA)准则训练多个二分类感知机,以Gini指数筛选最优的方法构建二叉决策树.推算说明感知机多分类准则在每个树节......
针对以信息增益为划分标准的ID3算法中存在偏向属性取值多的属性等问题,提出了一种融合GINI指数的ID3改进算法。计算每个属性的信......