多值偏向相关论文
本文针对决策树学习过程中存在的多值偏向问题,提出两种改进方法,从不同的角度来解决ID3算法的缺陷并优化决策树学习算法。同时,在......
随着人们对数据挖掘理论的不断探讨和研究,数据挖掘技术在各行各业中的应用日趋广泛和成熟。在诸多的数据挖掘技术和方法中,决策树......
随着Internet应用的迅猛发展,电子邮件得到了越来越广泛的应用。电子邮件一方面给人们提供经济、方便和快捷的服务,另一方面也给一些......
属性约简是粗糙集理论研究中的关键问题之一.文中定义了一种新的属性重要性度量准则,克服了多值偏向性问题,并给出一种新的属性约......
ID3算法是决策树学习归纳和数据挖掘中的核心方法。针对ID3算法存在的多值偏向问题,该文提出了一种新的方法对ID3算法加以改进。首......
ID3决策树算法是构造决策树的重要算法之一,然而实验表明该算法在选择分裂属性时存在着多值偏向问题。以往的大多数学者都是基于实......
为了克服决策树算法中普遍存在的多值偏向问题,提出了一种新的基于关联度函数的决策树算法———AF算法,并从理论上分析了它克服多......
决策树是从一组数据中生成分类器的一个行之有效的方法。其中ID3算法是目前引用率较高的算法。ID3算法是以信息熵为核心的分类预测......
针对ID3算法的多值偏向问题,提出一种基于属性相似度的、能够避免多值偏向问题的ID3改进算法——NewDtree算法,并应用理论分析方法对......
ID3算法是决策树算法中的经典算法,但存在多值偏向问题。一些改进的ID3算法虽避免了多值偏向问题,但多存在主观性强、没有考虑属性信......
数据挖掘技术能够从海量数据中挖掘有价值的信息,是处理大数据最有效的技术方法之一。分类是数据挖掘中最重要的内容之一,分类技术......
ID3算法是决策树中影响最大的算法之一,它以信息增益为标准选择决策树的测试属性。这种算法存在不足之处,在选择合适的测试属性时,倾......
数据挖掘就是从大量的、不完全的、有噪声的数据中,提取出有效的和潜在规律性信息的过程。数据挖掘的任务就是从数据集中发现模式,......
随着数据库技术的逐步成熟,分类预测之类的数据挖掘技术也得到了高速的发展,分类预测技术中的决策树方法也常常被应用于多个行业领......
决策树的属性选取标准在决策树算法中处于核心地位,针对数据集的不同特征人们提出了多种不同属性选取标准。该文首先回顾了几种常......
通过分析ID3算法的多值偏向问题和传统ID3改进算法中出现的主观性等问题,提出了一种基于权衡因子的决策树优化算法.该优化算法通过......