基于改进的k均值聚类算法的P2P流量识别的研究

来源 :东北林业大学 | 被引量 : 0次 | 上传用户:huiyuanai852
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,P2P技术以丰富快捷的资源共享等特点获得了迅速的发展,给人们的生活带来了很大的便利,但同时也带来了网络的拥塞、带宽的消耗等问题,运营商不得不增加更多的带宽来保证服务质量。随着P2P应用的不断增多以及网络规模的扩大,运营商就会陷入“拥塞-增加带宽-再拥塞”的死循环,不但不能保证基本的服务质量,而且增加了带宽上的成本。解决该问题的根本方法是实现对P2P流量的准确快速识别,根据实际状况对流量进行合理控制和优化管理。本文介绍了P2P技术的结构特点和发展情况以及P2P流量识别方法的研究现状,并分析了在P2P流量识别中的机器学习算法,通过比较有监督的机器学习算法、无监督的机器学习算法和半监督的机器学习算法的优缺点,采用半监督的机器学习算法进行P2P流量识别。首先,针对P2P流量中存在的冗余特征和不相关特征,采用CFS算法进行特征选择,该算法能够不仅能够保证分类的准确率、高效地完成特征选择,还可以去除P2P流量中的冗余特征。其次,针对k均值算法每次迭代过程中都需要对所有数据进行距离计算的问题,利用球树进行改进,减少了迭代次数,提高了聚类效率;针对k均值算法识别准确率低的问题,利用少量标记样本作为指导,获得有指导性的初始聚类中心,再进行聚类,根据改进后的k均值聚类算法,利用weka3.7进行实验验证,实现了P2P流量的准确快速识别。最后,构建P2P流量控制系统,采用二维动态流控技术,实现了对BT等P2P流量的有效控制。
其他文献
造纸机烘缸表面温度是决定纸张产量和质量、影响蒸汽消耗的关键参数之一,生产上迫切要求对它进行自动控制.烘缸表面温度受影响因素众多,其控制算法单一;干燥部热力系统结构变
该文致力于基于T-S模型的离散系统的传感器故障诊断研究,针对存在系统噪声和系统状态时延两种情况,提出了相应的传感器故障诊断方法.该文系统地介绍了国内外控制系统故障诊断
锅炉控制系统是一个典型的多输入多输出系统,系统存在惯性滞后、非线性、时变、难以建立精确的数学模型等特点,仅仅采用传统的控制理论,如PID控制效果不理想.而模糊控制与传
该文的研究目标是利用0.6μmDPDMCMOS 工艺设计一种高性能的数模混合锁相环核.研究内容包括锁相系统的模型建立与系统仿真、锁相系统中的各个模块设计,包括鉴相器、电荷泵、
Quanser无人机系统(Unmanned Vehicle Systems)的实验平台是由六个OptiTrack摄像头、Qball-X4四旋翼无人机、Qbot地面机器人、PC主机、内嵌实时控制软件QuaRC的MATLAB/Simuli
随着传统有线电视网络及其设备双向改造的完成, HFC(Hybrid fiber coax),即光纤同轴混合网已成为向用户提供双向宽带综合业务的重要途径。为了兼容传统的有线电视传输模式,HFC网络
该文介绍了基于DSP(TMS320VC5402)的指纹门禁控制器的一些基本概念、识别算法设计和主要功能模块的原理、设计和实验方法.该控制器的身份识别方案是输入密码和指纹,将密码对
嵌入式系统设计是电子技术应用的新热点.同通用计算机系统相比,它有体积小、成本低、应用灵活等优点,现在已经得到广泛的应用.该文以中央储备粮赤壁直属库粮情监控系统的设计
该文采用了OMG提出的CORBA方案,并结合多代理技术对企业信息系统进行集成.这种基于CORGA和MAS的集成机制的基本思想是:以CORBA方案作为企业信息系统的底层通信框架,实现软件
计算机网络技术和Linux技术的飞速发展为基于嵌入式Linux的应用奠定了技术基础,并将成为进一步推动后者快速发展的技术动力;嵌入式Linux的应用无疑会对现实社会的各领域带来普