流量识别特征选择算法的研究与改进

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:dajiangdq68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了对移动互联网进行更细粒度的网络管理,流量识别和检测技术被广泛应用,其根据应用类型的不同可将网络流量划分成不同的类。流量识别有很多实现的技术,如基于端口,基于载荷,基于主机行为的识别方法。在这其中,机器学习法由于它较高的准确率得到人们的广泛关注。特征选择为机器学习法选择最优特征子集,其对算法的准确率和效率有非常大的影响。为了获得最优特征子集,往往需要对所有可能的特征组合进行测试。当特征数过多时,特征选择将会耗费大量的时间和计算资源。本文首先简单介绍了流量识别的相关技术,对机器学习分类算法和常见特征选择算法进行了概括和比较。在此基础上提出两种新的特征选择法:1、基于C4.5决策树的组合树算法。该算法主要利用了C4.5算法的结构特性,在没有实际训练和测试分类器前,可以排除原始特征集中的一些冗余属性。2、基于SVM-Wrapper与粗糙集相结合的RSF算法。基于粗糙集的属性约简方法简单易用,但当特征数过多时,计算量则会指数级增长。而本文所提出的RSF算法首先通过SVM-Wrapper对原始特征集进行初步约简,在此基础上再使用粗糙集进行属性约简,可以解决属性约简过程中特征数过多所引起的计算量过大的问题。通过实验和仿真,证明这两种方法可以大大减少特征选择过程中所耗费的时间和计算资源,所获得的特征子集也为最优特征子集。
其他文献
[中图分类号]:G613 [文献标识码]:A  [文章编号]:1002-2139(2017)-14--01  语文组教给我一个很“艰巨”的任务,就是给高一学生上一节关于《红楼梦》的课,这对于我来说真的是十分困难,因为我实在是太喜欢这部书了,对于任何一个人物我都有特别想说的话,可是我太担心我解读得不够好,不能达到我想要的效果——课一讲完,就能掀起一股读名著的热潮,而且经久不息,我希望所有的学生都喜欢
期刊
伴随着信息技术的高速发展,信息安全问题日益突出。密码技术是实现信息、隐藏、完整性验证、身份认证的有效途径,是确保信息系统安全的关键技术之一。椭圆曲线密码(ECC)由于
新兴的事物因其很多的不确定性引发了职业经理人的憧憬和幻想,对传媒人也不例外。在新媒体我们总能见到一些被浪漫笔触描绘的杰出人物,他们往往被认为集天赋、志向、经历于一
本文提出,论文写作要基于行动跟进,基于教师的教育教学实践。教师每天都在有意识或无意识地做着研究工作,研究学生,研究教学,研究课堂,研究教育。所以我们可以从活动策划、调
近年来,由于无线网络的应用越来越广泛,如何给用户提供一个安全的网络接入环境是目前极为重要的问题。为了解决无线网络中的安全问题,安全认证是一个可行的方法。可扩展认证协议
随着互联网的迅速普及,信息安全问题日益突出密码技术是保障信息安全的核心技术公钥密码尤其是椭圆曲线密码(ECC)得到了广泛应用,ECC所涉及的有限域算术成为研究热点其中,乘法运
吴昌硕是我国近代艺坛享有盛名的一位大艺术家、篆刻大师,诗、书、画、印兼能并擅,各臻其妙。道光二十四年(1844)他出生于浙江省安吉县鄣吴村,家境贫寒。青少年时,遭兵祸逃亡
此时此刻,福建省广电系统“创文明行业建和谐海西”现场经验交流会正在举行中。会上,福建省广电局党组书记、局长翁星,局 At this moment, Fujian Provincial Radio and Tel
当前,信息网络正深刻地影响着官兵的生活方式和思想行为。信息网络平台丰富了军队思想政治教育资源的种类,拓展了储备资源和利用资源的空间,为基层官兵提供了抒发自己情绪和
至2011年以来,即时通信跃升为中国互联网第一大上网应用,伴随着移动智能终端的普及,手机即时通信用户更是达到了3.52亿,即时通信产品成为了人们生活中常用的沟通交流工具。与此同