论文部分内容阅读
提出一种基于IN算法构造分类器的剪枝优化算法CIN.针对IN算法利用对数似然比统计量进行假设检验存在的统计意义不明确的问题,本文算法在给定层每一节点引入了样本数阈值和属性值阈值的计算。从而保证检验的有效性.给出了算法的理论依据。并且推导出了对数似然比统计量计算公式成立条件.实验表明,该算法能够消减数据维数并且可以从大规模数据集中提取简明的规则.