基于双抽样的测量流长度分布的算法研究

来源 :大连海事大学 | 被引量 : 6次 | 上传用户:sycloverock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络流量测量和分析对于网络管理、网络规划和网络安全应用等都有非常重要的作用。近年来随着网络带宽的高速发展,信息量快速增加,要测量网络中的全部数据流量变得越来越困难。如何快速准确地测量网络流量成为一个研究热点。为了解决网络测量所面临的问题,人们提出了抽样测量技术,即抽样测量部分流量,然后从统计学角度估计原始流信息。抽样测量技术分为基于流的抽样和基于报文的抽样。基于流的抽样估计精度高,但是资源消耗量大;基于报文的抽样可扩展性好,但是估计精度低。本文在分析基于流的抽样技术和基于报文的抽样技术的基础上,提出了双抽样方法。双抽样方法的抽样流需要经过两次抽样才能获得。首先进行流抽样得到一组抽样流,然后进行报文抽样,得到最终的抽样流。以网上采集的Traces进行抽样试验,经对比分析表明与单纯的报文抽样和流抽样相比,双抽样方法在系统资源消耗方面有很大优势,减少了抽样过程中所要维护的信息量。为了解流量及所需资源情况,知道未抽样流的长度和数量是有意义的,本论文研究了如何由抽样报文流统计数据推断出所对应的未抽样流的统计数据的算法。抽样会造成信息的损失。首先,分析了双抽样方法中信息损失情况,第一步的流抽样导致了原始流数量的减少;第二阶段的报文抽样在第一阶段抽样流的基础上既有流数量的减少,也有流长度信息的损失。针对流抽样的估计,根据流被抽空的概率大小将流分为长流和短流,对于长流用比例法估计;对于短流用EM算法估计,得到了由第一阶段流抽样所得抽样流的流长分布。针对报文抽样的估计,用比例法在前一阶段估计得到的抽样流基础上,得到了原始流的流长分布情况。实验结果表明,由双抽样方法得到的抽样流能够有效地估计出原始流的分布。
其他文献
随着网络的不断发展,特别是移动互联网和物联网,网络已成为生活不可或缺的一部分。伴随网络发展而来的是,网络安全、服务质量和网络管理等一些列相关问题日益突出。如果不能
随着Web服务的大量涌现和Web服务研究和应用的不断深入,如何自动、准确、高效的进行服务的发现,已经成为Web服务研究中的热点和难点。由于Web服务缺乏语义描述,传统的基于关
随着高速网络环境的日益普及,传统网络入侵检测系统(Network Intrusion DetectionSystem,NIDS)检测海量网络数据报文时普遍存在检测效率不高、处理能力不足及丢包率较高等瓶
随着计算机软件技术和信息化的不断发展,近年来易货贸易也得到了飞速发展。易货贸易系统的各个子系统涉及到不同的部门和机构,管理着不同的对象,但是它们之间也有很多相互交
海量数据处理技术的发展,使数据挖掘算法所要训练的数据量级呈几何式增长,为了降低计算难度,较多的数据挖掘算法在求解最优化问题时采用迭代式的方法。数据的样本输入以及迭
视频目标分割是计算机视觉领域的一个热点问题,它是视频监视、人机交互以及视频编辑等众多应用系统的基础,高效准确的视频目标分割算法可以大大降低后继应用的处理难度。视频目
三角剖分在曲面重构、医学成像及地理信息系统(GIS)等领域有着广泛的应用。   本文结合地质数据的特性设计一种三角剖分算法,它杂度低,还能保证高质量网格的形成。Delaunay
现如今,各行各业都在使用计算机软件,都力求实现信息化管理。特别是一些比较典型的行业,例如金融、医疗、通信、保险等,信息化程度已经达到了比较高的程度。BI(商务智能)管理
电信增值业务的迅速发展给运营商带来了丰厚的收益,特别是彩铃等优势业务的不断壮大,很大程度上提高了客户的ARPU(Average Revenue Per User)值.,如何保障这些增值业务的运行
研究表明,近似镜像网页数占总网页数的比例高达29%,而完全相同的页面大约占22%。根据CNNIC 2005年7月发布的统计报告,用户在回答“检索信息时遇到的最大问题”这一提问时,选