【摘 要】
:
针对异常检测中异常数据与正常数据的比例严重不平衡导致决策树性能下降的问题,提出了C4.5决策树的三种改进方法——C4.5+δ、均匀分布熵(UDE)和改进分布熵函数(IDEF)。首先,
【机 构】
:
数学工程与先进计算国家重点实验室战略支援部队信息工程大学
【基金项目】
:
国家自然科学基金资助项目(61802431)~~
论文部分内容阅读
针对异常检测中异常数据与正常数据的比例严重不平衡导致决策树性能下降的问题,提出了C4.5决策树的三种改进方法——C4.5+δ、均匀分布熵(UDE)和改进分布熵函数(IDEF)。首先,推导了C4.5算法中属性选择准则会倾向于选择偏斜划分的属性;然后,分析了偏斜划分使得异常(少数类)检测精度下降的原因;其次,分别通过引入缓和因子、均匀分布熵或替换分布熵函数改进了C4.5算法的属性选择准则——信息增益率;最后,利用WEKA平台和NSL-KDD数据集对改进的决策树进行验证。实验结果表明,三种改进方法均能提高异常检
其他文献
目的:分析颈动脉超声检查在缺血性脑病诊断中的临床应用价值。方法:选取60例缺血性脑病患者作为观察组,选择同期健康体检者60例作为对照组,对两组患者进行颈动脉超声检查,对
农民有了生产和种植的自由,是生产力的一个飞跃,但当农民增产不增收、大量的农产品无法销售出去,一年甚至多年的辛劳和企盼变成了泡影时,又使农民感到困惑和迷茫.中国农民的
改性沥青路面因其良好的性能和显著的经济效益,近年来在公路工程中得到广泛应用,但碾压不够、路面残留空隙率过大等问题一直未得到解决。文中就AK13和AK16改性沥青混合料的碾压
随着我国财政专项资金规模持续扩大,对财政专项资金实施审计非常必要。财政专项资金补助范围广、涉及多个政府部门,且具有补助金额大、补助项目分散等特点,审计人员如果使用