P2P流量识别技术研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:nescafe_k
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
上世纪九十年代末,P2P(Peer-to-Peer,对等)网络技术伴随着著名的MP3共享软件Napster的出现重新登上了历史的舞台,自此许多基于P2P技术的应用应运而生,并以迅雷不及掩耳之势快速发展。各类P2P应用为人们的工作和生活提供了多样化的服务,为企业带来了巨大的商业价值;然而它在给人们带来极大便利的同时也产生了许多负面影响,例如:大量占用网络带宽导致网络拥塞,影响了服务的可用性、可靠性和服务质量;文件共享导致的法律隐私问题等等。因此,如果能及时检测出网络中的P2P流量并对其进行合理的监控,对于保障网络的安全具有非常重要的现实意义。   本文首先分析了P2P网络技术的优缺点,进而引出对网络中P2P流量进行识别研究的必要性。然后对当前国内外典型的P2P流量识别技术作分类介绍,比较并归纳了其优缺点,在此基础上提出了一种基于机器学习一遗传概率神经网络的对等网络流量识别方法,即首先使用Relief和CFS特征选择算法相结合的方法选取最优特征集,减少冗余,降低特征向量的维数,确定并提取特征向量;然后使用遗传算法优化概率神经网络的平滑因子σ并构造概率神经网络分类器;最后将特征向量作为优化后的概率神经网络的输入进行P2P流量的识别。总之,论文的主要工作如下:   (1)深入分析了P2P流量区别于其他网络流量的典型特征。鉴于较少的特征属性不能完全体现出这两类网络流量的区别,而较多的属性又会影响分类器的性能,本文引入Relief-CFS特征选择算法提取最优特征集,降低特征向量的维数。   (2)给出了一种流量特征和概率神经网络相结合的方法对网络流量进行分类,克服了当特征向量的维数增加时,难于使用阈值分类的弱点。   (3)对于概率神经网络概率密度函数中平滑因子σ值难以确定的问题,引入遗传算法对σ进行优化,选取最佳的平滑因子值。   (4)针对上述方案在MatlabR2010a中进行仿真验证,从虚报率、漏报率和正确率三个方面对其进行评估,对比实验表明本文提出的将遗传概率神经网络算法用于P2P流量识别的方案是可行的。   (5)在上述工作的基础上,基于.Net开发环境,设计了一个P2P流量识别原型系统,可同时用于离线和在线流量识别。
其他文献
在复杂网络分析中,社区发现是该领域的重要课题。如何快速有效地将复杂网络中的社区挖掘出来呈现给数据的使用者越来越受到研究者的重视。本文基于谱图理论中的代数连通性函数
随着信息化时代的到来,各行各业已经离不开计算机软件,但现如今的软件产品不能满足人们对于高质量的软件的需求,如何高效的设计与开发出高质量的软件产品是当今学者研究的课
随着信息技术的迅猛发展,人们可以通过互联网不断地从世界各地交换信息,同时,XML也成为了网络上各种应用程序交换异构数据的新兴标准。面对大量XML。数据的涌现,XML数据检索表现
近年来,随着计算机在人们的生活中起着越来越重要作用,人们对人机交互兴趣日益增加,越来越渴望更加人性化、智能化、和谐的人机交互系统,这一切逐渐推动着情感识别成为研究的热点
高强度聚焦超声(HIFU)治疗在治疗肿瘤中表现出诸多优势,然而研究者发现,由于人体组织的复杂性,超声束在人体传播中会发生折射、反射等物理现象,超声束难以按照理想的传播路径聚焦
随着计算机网络的高速发展,计算机给我们带来便捷的同时,也时常受到非法访问和恶意攻击。网络安全问题日益突出,因而越来越受到人们的关注和重视。入侵检测技术作为安全审计
随着高校建设的飞速发展,太原理工大学配电网规模的不断扩大,师生用电需求与日俱增,电网结构日益复杂,变更频繁,传统的供电线路检修和维护的方法暴露出了许多不足,配电网人员只能靠图纸和配电人员的工作经验进行诊断,通过大范围实地调查线路的实际情况,耗费大量的人力、财力、物力,浪费时间,且故障诊断效率低,还影响师生的用电质量。因此,如何有效将空间地理资源与配电网信息数据相结合,实现数据的共享,提高资源利用率
随着政企信息化建设的深入,各行各业都形成了极具价值的专业领域信息源。当前基于关键字的搜索引擎技术在通用信息检索中已经取得了很好的应用成果,然而,在面向专业领域时依
Chord在结构化P2P系统中普遍的运用,其原因是由于其具有简单、可扩展性高、小路径长度的网络规模和灵活的节点加入及离开机制的显著特点。P2P网络中的关键问题是如何有效地定
牙齿分割是计算机辅助口腔正畸计划的重要步骤,其主要任务是从患者的牙颌数字模型中对牙齿进行识别、定位与提取。高效而精准的分割方法,能够更好地提取牙齿特征,建立准确的三维