基于皮尔森系数距离权重KNN算法的P2P流量分类方法研究

来源 :湖南工业大学 | 被引量 : 3次 | 上传用户:joinsoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在P2P技术不断的发展过程中,P2P技术在文件共享、数据存储、多媒体等业务上所体现出来的优势,使得P2P流量成为整个互联网流量的主体,然而P2P网络凭借着自身对等覆盖网络的特性,给互联网提供商在其管理和维护上带来了巨大挑战。P2P技术带来的巨大挑战包括:互联网的主体流量被P2P流量所占据,非P2P流量在带宽资源的利用率上明显不足,导致非P2P应用在可用性上无法得到保障;随着技术不断更新迭代,越来越多的P2P应用开始使用随机端口和协议加密技术,使得P2P应用所带来的信息安全问题日益凸显;传统的P2P流量识别技术主要基于应用端口、应用层签名、行为特征,但随着P2P技术日益复杂,传统的识别技术已经无法满足现有的需求。机器学习作为一门使用计算机模拟人类行为活动的科学被广泛应用,机器学习方法主要是将不断变化的外界信息传递到机器学习算法中,从而建立一种算法模型,此算法模型能够根据外界环境的变化来提高自身的学习能力。本课题是针对P2P流量分类方法的研究,通过对比传统的P2P流量分类方法,研究机器学习方法在处理P2P流量分类问题上的优势,本文的主要工作如下:1.基于对ReliefF特征选择算法的研究,分析其优缺点,在ReliefF算法基础上提出一种改进的MS-ReliefF算法。MS-ReliefF算法从纵向和横向两个维度对原始特征集进行特征约简,纵向通过联合特征权重选择最优特征对,横向计算特征之间的相关性去除冗余特征,最终得到最优特征子集。2.通过分析传统的KNN算法,在传统的KNN算法基础之上,提出一种改进的PSDW-KNN算法。PSDW-KNN算法引入了特征距离权重和皮尔森相关系数,在传统的KNN算法之上,给不同特征赋予相应的权重,并且通过皮尔森相关系数计算出样本之间的相关程度。通过实验对比了传统的KNN算法、DW-KNN算法和改进的PSDW-KNN算法,实验结果表明PSDW-KNN算法在近邻K取值较小且训练样本数较大的情况下,具有更高的分类准确度。3.为了提高机器学习算法模型的计算能力,本文借助Spark分布式运算框架的计算能力,将本文提出的PSDW-KNN算法与Spark MLlib机器学习库相结合,构建了原型系统,进一步提高算法模型的分类识别效率。
其他文献
《古文尚书·大禹谟》“人心惟危,道心惟微,惟精惟一,允执厥中”四句,被宋明理学家称为“虞廷十六字”,它对于宋明新儒学的道统论、心性论、工夫论皆甚为重要,意义不容忽视。以往研究多从宋明理学的道统论处着眼,鲜少有将十六字单独拎出来,研究其在整个理学发展史上的流传与阐释的,本文试图在以往研究的基础上进一步从思想史的角度作新的解读。本文除引言外分四个章节组成,第一章介绍虞廷十六字从政治领域的帝王之术到儒家
目的:通过建立人脐带间充质干细胞来源的外泌体(human umbilical cord mesenchymal stem cell-derived exosomes,hucMSC-Ex)修复葡聚糖硫酸钠(dextran sulfate sodium salt,D
黏土基微孔陶瓷管道是一种兼具灌溉和输水功能的新型渗灌管,利用其内部孔隙将灌溉水输送到作物根区土壤的节能环保型渗灌装置。与塑料渗灌产品相比,微孔陶瓷具有成本低廉,经
汽车板减薄减重是汽车轻量化的重要手段之一,在减薄减重的同时要保证汽车的安全性,因此车用高强钢成为发展趋势。目前,汽车上应用最广泛的先进高强钢主要为DP钢,DP钢的广泛使
直接液体燃料电池(DLFC)是一种转换效率很高的绿色能源,近年来受到越来越多的关注。催化剂是DLFC的重要组成部分,开发性能好成本低的催化剂对DFLC的商业化具有重要意义。为此,
21世纪,现代技术在相应发展,人民物质的生活在不断提升,社会公众对精神文化方面需求也越来越高。图书馆因用户而存在,服务是图书馆永久的工作重心。图书馆质量管理的目标是保证“用户满意”。新型城镇化的发展推动了社区图书馆的发展,意味着进入了全民阅读时代。如何推动社区图书馆稳妥发展并保障用户的信息需求,显然是一个值得深入探讨的重要命题。这需要选择科学手段来评价社区图书馆的服务质量,继而切实提高其服务供需满
牡丹是我国十大传统名花之一,花大色艳,雍容华贵,一直深受广大人民的喜爱。牡丹花色虽然有九大色系,但少有变色品种。‘凤丹’牡丹在开放过程中存在着花色变化的现象,花色由
本文主要研究带有非局部项非线性项的Schr(?)dinger方程在强拓扑H1(Ω)中全局吸引子的存在性问题,进一步研究了吸引子的正则性问题,即,当f∈ C2时,A(?)H2(Ω).该方程来源于超短激光脉冲模型.本文主要采用先验估计方法,分别证明了非线性Schr(?)dinger方程解的存在唯一,性和半群{S(t)}+t≥0的渐近一致紧,最终得到吸引子的存在性.全文共分为四个部分:·第一章,主要介绍
文化是城市的灵魂,保护城市文化就是在为城市保留特色与发展的根基。历史文化街区作为传统文化的重要载体,它们见证着城市的演变与发展,是城市的文化名片。在现代化进程的不
本文我们证明了离散化的改良三维Bénard系统解所定义的算子半群在相空间中全局吸引子的存在性.首先,我们证明离散化改良三维Bénard系统在相空间中解的存在性.然后证明该系统在相空间中全局吸引子的存在性.最后,讨论该系统的解在N趋于无穷大时的渐近行为.全文共分为五个部分:·第一章,主要介绍证明吸引子存在性的预备知识和本文的主要结果·第二章,研究有界区域上一类离散化的改良三维Bénard系统解的存在