论文部分内容阅读
分析了信息论中条件熵在高维数据集中的应用,并对KDDCUP’99训练集的各维属性进行分类,然后对有42维属性的KDDCUP’99训练集分别计算前41维条件属性和第42维决策属性的条件熵,按条件熵的值进行升序排序,就能发现条件属性相对于决策属性的重要程度.实验结果表明该算法可以把KDDCUP’99数据集的维数降低到一定程度,而且几乎不影响入侵检测的效果.