基于特征进程和数据挖掘的P2P流量识别技术

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:raun395924241
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着P2P(Peer-to-Peer)技术的发展,P2P应用在互联网中迅速蔓延,由于其在文件共享、资源搜索、分布式计算等方面的优点,使得其成为网络中最重要的组成部分。但是在P2P技术对互联网带来巨大推动作用的同时,其也造成了网络带宽的巨大损耗,甚至引起了网络拥塞,从而导致其他非P2P技术的业务性能的降低,并为网络安全带来了隐患。因此,对P2P流量和网络行为进行有效地监控和管理成为网络运营的重要课题。而如何识别出P2P网络应用产生的网络流量,是对网络流量进行有效监控和管理的关键技术。本文研究了目前已有的P2P流量识别技术,并分析了其原理和特点。基于端口的识别技术使用端口号来识别,但P2P网络应用早已能够通过使用动态端口和伪装端口来躲避检测;基于负载信息的识别技术通过匹配数据包的载荷来识别,该技术准确性高,并能分类P2P应用,但是其对于加密的流量很难检测;基于流量特征的识别技术根据P2P不同于其他网络协议的流量特征检测流量,该技术无需对数据包的具体内容进行分析,无需解析和还原网络协议,因此能够很好地识别加密流量,但其需要大量的离线分析。因此,需要找到一种准确而高效的识别P2P流量的方法。本文研究了能够应用于P2P流量识别的数据挖掘技术,并利用便捷的网络流量采集工具和机器学习平台,对常见的聚类挖掘算法进行了仿真,对各个算法的性能进行了分析。在此基础上,提出了一种改进的P2P流量识别系统,包含客户端和服务器模块。(1)客户端主要负责系统的P2P流量识别功能。结合基于特征进程和基于数据挖掘的两种P2P识别技术,对网络中P2P流量进行实时检测。利用基于特征进程的识别技术检测操作系统的P2P进程,具有很高的准确性;使用无监督的机器学习方法识别未知的P2P流量,具有较高的识别效率。(2)服务器负责接收P2P识别消息,更新和管理网络的P2P进程库。
其他文献
混合自动重传请求(HARQ)技术结合了前向纠错(FEC)和反馈重发(ARQ)这两类方法的优点,利用重传和纠错机制,提高系统的可靠性。在无线通信网络中引入中继协作技术,可以为用户提
目前,在自然科学领域,大多数的研究都是集中于实数域,但实数域的应用具有一定的局限性。很多经典系统与工程技术都适用于复数域,如经典的量子系统以及通信、图像分析、语音解
近年来,无线自组织网络定位研究得到了研究人员的高度重视。定位技术在军事、工业、民用等众多领域都具备极高的应用价值,如战场上士兵与士兵间的相互布位和配合,抢灾救险过
传统的通信网络在适应动态网络环境的能力方面存在局限性,这对优化网络性能构成了阻碍。为了解决这一问题,研究人员提出了认知网络(Cognitive Networks)的概念。认知网络是一
串行级联连续相位调制(SCCPM)是串行级联卷积码(SCCC)和CPM调制的结合,不仅具有串行级联编码的高编码增益,而且具有连续相位调制信号恒定包络和高信道利用率的特点。另外SCCP
随着计算机、无线通信和传感等技术的日益发展,无线传感器网络(Wireless Sensor Networks,WSN)已广泛应用于军事作战,医疗管理,森林防火和空气质量监测等多个领域。当无线传
随着互联网的迅速发展以及网络复杂性的不断增加,网络安全问题日益严重。计算机病毒以其传播速度快、影响范围大、破坏力强等特点已经成为目前互联网面临的最为严重的安全威胁
近年来,随着无线通信技术以及普适计算的快速发展,基于位置的服务(LBS)在日常生活中的应用越来越广泛,而定位技术是实现基于位置服务的必要环节和核心技术。由于信号在传播中
无线宽带技术使人们摆脱了传统的有线通信的束缚,让人类进入了移动通信时代。面对广大的应用和研究市场,无线移动通信技术得到了快速发展,促使第一代移动通信(1G)到第三代移
在现代信号处理中,非线性和非平稳信号的处理尤为引人注目。各种非线性、非平稳信号处理方法的不断涌现,使得人们在处理这类信号时不必只依赖于传统的傅立叶变换而可以获得更