面向高速网络环境的流量分析与识别方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ie8848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网快速发展,各类网络应用给大众生活带来便捷,同时也给网络监控和管理带来了巨大的挑战,如P2P应用流量逐年上涨,互联网服务提供商(ISP)不得不对该类型流量做适当策略限制,以免影响其他用户正常使用网络。而要实现上述的管理机制,离不开对网络流量的分析和识别,只有知道当前网络中的流量成分,才能采取进一步的分析和处理工作,因此流量分析与识别方法是众多安全监控技术的基石。然而,在目前高速网络环境下,网络流量暴涨,传统的流量识别方法面临着很多问题,如处理时延、内存瓶颈等。因此,本课题主要研究了面向高速网络环境的流量分析与识别方法,围绕如何利用少量的载荷数据准确识别流量以及如何加速识别过程这两个问题,取得了如下研究成果:  1、提出一种基于n-gram多特征的网络流量载荷类型分类方法:在使用每条流lk字节数据的情况下,用n-gram方法分割子串,并在高频子串集合上提取多种特征,能够将网络流量分为文本、音频、视频、图片、可执行程序、压缩等7种类型。实验结果表明,本文方法提高了多载荷类型分类的准确率和召回率。  2、提出一种针对非加密网络应用的协议特征词提取方法:DPI方法识别准确度高,需要载荷数据少,被广泛应用于安全设备中,但其依赖于有效的协议指纹特征,为了应对网络应用快速更新的节奏,本文提出一种自动化提取有效特征词的方法,主要分为两步,首先利用无监督方法生成协议候选词,并根据词频、位置等信息减小词集规模;然后利用基于频繁项集挖掘的特征词提取方法,通过评估候选词的共现关系删除噪声词和冗余词,最终按照覆盖率提取出有效的协议特征词。最后通过实验比较,验证了本文方法的特征词提取效果。  3、提出一种基于DstIP-DstPort服务标记的流量快速识别方法:目前已有的流量分类识别方法为了保证识别效果难免计算量大、占内存,因此本文使用已识别的历史日志,通过三级缓存技术来有效标记DstIP-DstPort的服务信息,在有新网络流时,通过查表方式输出流量的应用类型,避免冗余的识别操作。实验结果表明,通过DstlP-DstPort服务标记识别流量准确率能达到99%以上,且能够加速较大比例的流量。
其他文献
模糊测试(Fuzz Testing)是在2000年之后才逐步兴起的一种非常重要的漏洞挖掘技术。它基于目标软件对输入验证的不完整性假设,通过向目标软件提供非预期的输入并监视异常结果来
随着网络带宽的发展以及人们接入网络方式的日益多样化,流媒体直播作为日常生活中常见的一种网络服务所吸引的用户在逐渐扩大,基于对等网络的相关技术研究的应用也推广了流媒
网络技术、分布式计算技术和三维可视化技术的飞速发展,为分布式三维地理信息系统(3DGIS)技术的实现提供了契机。其中,最主要的分布式3DGIS技术主要体现在网络三维可视化方面,即
现代处理器之间及对外设的互联通信数据需求越来越高。高速串行接口代替原有的并行接口,成为主流的互联接口。在高速接口中,非源同步串行接口更加节省通信信道资源。因此,在外设
当前,计算机和互联网在现代人的生活中无处不在,已经融入到人们的日常生活、工作、学习中。在计算机硬件性能大幅度提升和软件技术蓬勃发展的今天,计算机已经遍布人类社会的
随着互联网的迅速普及,人们的生活方式已经发生了极大的改变,互联网也将人类带入了大数据时代。在大数据时代,作为一种典型的半结构化文本数据,社交网络数据具备十分重要的价值,利
工作流管理系统(Workflow manangement System)在企业中的重要性日渐凸显.它的主要特点是使计算机上的处理业务流程自动化.基于构件的系统(Component-Based System)是90年代
虚拟现实(VR)是人类在探索自然过程中创造形成的一种用于认识自然、模拟自然,进而更好的适应和利用自然的科学方法和技术。随着软、硬件技术的发展,在虚拟环境中进行产品三维
随着网络技术的迅速发展,网络已经广泛地应用于社会的各行各业。在各行业越来越依赖于计算机网络的同时,网络中设备的种类也越来越多。不同种类网络设备的管理方式和认证方式也
随着资产数字化技术的快速发展,互联网端到端价值交换成为学术界和产业界关注的焦点。与信息不同,价值具有不可复制性、唯一性和归属性等特点,现有的互联网体系由于在设计之初旨