基于原型抽象和分类价值量的决策树算法

来源 :计算机应用研究 | 被引量 : 2次 | 上传用户:hebeikbyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了克服现有决策树分类算法在大数据集上的有效性和可伸缩性的局限,提出一种新的基于粗糙集理论的决策树算法。首先提出基于代表性实例的原型抽象方法,该方法从原始数据集中抽取代表性实例组成抽象原型,可缩减实例数目和无关属性,从而使算法可以处理大数据集;然后提出属性分类价值量概念,并作为选择属性的启发式测度,该测度描述了属性对分类的贡献价值量的多少,侧重考虑了属性之间以及实例与分类之间的关系。实验表明,新算法比其他算法生成的决策树规模要小,准确率也有显著提高,在大数据集上尤为明显。
其他文献
2010年11月至2011年4月在广西、云南采用简单随机抽样法布设标准地,调查研究细叶龙竹人工林生长情况,得出其高产栽培技术措施:选择热带、南亚热带地区土层厚度40cm以上的土山、
桐乡市曾先后获得多项园林绿化先进称号,截至2010年底已有23个村被命名为“浙江省绿化示范村”,但对照浙江省森林城市评价标准还存在着建成区林木覆盖率较低,森林结构与布局不尽
校企合作是独立学院的生存、发展之路,校企合作企业在独立学院的办学过程中为学院指明了人才培养方向,是学院学生实习、就业的主要接纳者。
华北花岗片麻岩山区土壤严重退化,恶劣的土壤环境是该地区植被恢复的限制性因子.利用不同配比的化肥对试验区内土壤进行促成技术研究,结果表明:各种配比的肥料间,对土壤有机质
为了在噪声干扰以及目标和背景颜色相近情况下实现多目标跟踪,提出一种基于快速全局最小化的活动轮廓模型的目标检测跟踪算法。该算法结合了基于边缘的活动轮廓模型和基于区域的活动轮廓模型,对能量泛函进行全局最小化来检测目标活动轮廓,用卡尔曼滤波预测目标下一帧的特征信息,然后用改进的最近邻法进行多目标跟踪。对图像序列的实验结果表明该算法能有效地对运动背景下多目标进行跟踪。
对陕西省吴起县城周边地区进行样地植被和土壤调查,研究退耕还林过程中人工植被恢复区与自然植被恢复区的生态效益.结果表明,通过退耕还林可使植被得以恢复,达到控制水土流失
本研究以Swain的“输出假设”及其他有关输出的理论为研究基础.通过问卷调查验证了Swain“输出假设”中输出的三个功能:注意/触发功能,假设检验功能以及元语言功能,证实了输出对二
基于Vague集现有理论、经典集合和Fuzzy集的拓扑理论,运用分析的方法推广了经典集合和Fuzzy集的相关拓扑理论,初步给出了Vague拓扑空间和Vague连续映射的概念,并就它们的一些性质进行了讨论。所得结果扩展了Vague集理论的研究范围,并提出了该领域未来可研究的方向。
在云南保山市施甸县开展了5种不同肥料对蓝花楹幼树生长量的影响试验。结果表明,树高、胸径的生长量均以A处理(羊粪200g/株)为最好,其次是氮磷钾复合肥,再次是牛粪,最差的是F(对照,不
阐述天然林多目标综合管理概念、原则、方法和管理程序.天然林多目标综合管理以社会经济信息和资源信息为数据基础,以生态系统评估为依据,以土地利用战略规划为核心,以多部门共同