基于C4.5决策树的流量分类方法

来源 :软件学报 | 被引量 : 424次 | 上传用户:li86014446
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,利用机器学习方法处理流量分类问题成为网络测量领域一个新兴的研究方向.在现有研究中,朴素贝叶斯方法及其改进算法以其实现简单、分类高效的特点而被广泛应用.但此类方法过分依赖于样本在样本空间的分布,具有潜在的不稳定性.为此,引入C4.5决策树方法来处理流量分类问题.该方法利用训练数据集中的信息熵来构建分类模型,并通过对分类模型的简单查找来完成未知网络流样本的分类.理论分析和实验结果都表明,利用C4.5决策树来处理流量分类问题在分类稳定性上均具有明显的优势.
其他文献
通过具体问题具体分析对装车系统进行改造,以符合万吨列车的装车要求,此项目完成后具有操作方便、安全可靠,同时避免了皮带的频繁启动,延长了皮带、电机、减速箱等的使用寿命
目的:利用生物信息学方法预测miR-125b的新靶基因,在肝癌细胞系中进行验证和结合位点的鉴定,为阐明miR-125b在肝癌发生发展中的作用和机制提供新线索。方法:Western印迹分析在
利用智能型轨道检测小车GJY-H和BCB5.0开发的软件实现铁路状态数据的实时采集、动态显示和分析系统的建立。介绍了在BCB5.0的开发环境中利用SPCOMM组件和API函数进行串口通讯
研究独立多处理机任务静态调度问题Pm|fix|Cmax,即在m个处理机系统中调度n个多处理机任务,每个任务指派到所需一组处理机上不可剥夺地执行.该问题应用广泛但早已证明为NP难问题,而
局部线性嵌入算法极大地依赖于邻域是否真实地反映了流形的内在结构,现有方法构造的邻域结构是拓扑不稳定的,对噪音和稀疏数据敏感.根据认知的相对性规律提出了相对变换,并用其构造了相对空间和相对流形.相对变换可以提高数据之间的可区分性,并能抑制噪音和数据稀疏的影响.在构造的相对空间和相对流形上确定数据点的邻域能够更真实地反映流形的内在结构,由此提出了增强的局部线性嵌入算法,明显地提高了性能,特别是基于流形
Web用户评论是许多重要应用的信息来源,比如公众舆情的检测与分析,Web用户评论必须从网页中准确地抽取出来.用户生成内容(user-generated content)受页面模板的限制,这就Web数据抽
将无线传感器网络寿命定义为u及ξ的函数,即LT=f(u,ξ),其中,u是传输一个单位数据至基站(base station,简称BS)或接收点(sink)的平均能耗,眚代表在二维WSN区域内的流量分布.基于上述模型,详
在通信的源和目的间寻找两条(主用和备用)链路分离的QoS路径是提供可靠QoS路由的重要途径.现有求解多约束链路分离路径对(multi-constrained link-disjoint path pair,简称MCLPP)的
给出了一种具有最优代数免疫度的偶数元布尔函数的构造,同时还给出了一种具有最优代数免疫度的平衡旋转对称偶数元布尔函数的构造.在构造过程中用到了线性代数和组合计数中的有
数据包公平抽样通过牺牲长流的包抽样率以换取更高的短流包抽样率,因而比均匀随机包抽样更能保证数据流之间的公平性.现有的公平抽样算法SGS(sketch guided sampling)存在空间效