基于GPU的高性能包分类技术的研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:tltim2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络规模不断扩大,网络业务也急剧增加。互联网的性能已经难以满足日益增长的需求。数据包分类作为路由器、交换机等网络设备的核心功能,需要解决五元组规则匹配的问题,在一定程度上决定了网络包处理的吞吐率,进而影响整体网络性能。另一方面,在未来互联网架构的典型代表软件定义网络(SDN)中,数据平面需解决的核心问题是OpenFlow流表查找。其本质依然是数据包分类,只是域更多,规则更多,更新更频繁而已。因此,实现高性能的、灵活可扩展的包分类技术已经成为一个具有实际意义并且非常具有挑战性的问题。本文着眼于数据包分类这一网络包处理的核心问题,重点研究CPU/GPU协处理架构下的算法和结合优化,取得了一定的成果。首先,从经典包分类算法HiCuts入手,探索GPU加速包分类算法需解决的一般性问题。同时,通过引入高性能的包输入输出框架Netmap,本文搭建了一个简易的CPU/GPU协同包处理框架,实现端到端性能实测。实验结果表明,GPU加速可显著提升HiCuts的性能,但离线速处理还有较大的差距。这是因为HiCuts算法并未能充分利用GPU的硬件特点。因此,本文进一步结合GPU的并行机理及访存特性设计了一种新型的基于比特位图合并的包分类算法,并在算法的实现过程中充分利用CUDA平台来实现细节优化。实测结果表明,该算法相比于HiCuts,在GPU平台上能实现2.3倍至9.5倍的加速。最后,本文结合OpenFlow流表查找的需求和GPU的硬件特点设计并实现了一种基于比特分割的树形结构及相应的分类算法。初步实验表明,该算法不仅适用于多维度、大规模规则集的场景,并且支持高频率的规则集更新操作。
其他文献
目的:研究观察瞬时感受电位通道亚家族(transient receptor potential vanilloid4,TRPV4)通道是否参与糖尿病大鼠胸主动脉异常收缩,并对其可能机制进行探讨。方法:(1)选取6周龄健康雄性SD大鼠随机分为对照组(Control)和糖尿病组(Diabetic mellitus,DM);一次性腹腔注射链脲佐菌素(Streptozotocin,STZ,60mg/kg)
计算机视觉伴随着硬件性能与软件质量的提升取得了长足的发展,而行人的检测作为基础也是最重要的任务之一,始终是计算机视觉领域的研究热点。行人检测在智能安防、交通监控、
人脸识别技术作为生物识别领域中最重要的一门技术,已经具有几十年的发展历史了,随着技术的不断成熟已经渐渐的应用到了安全监控、人机交互以及远程教育等多领域中。具有应用
驾驶人姿态识别是车辆辅助驾驶领域中的一个热门研究内容,是人体姿态识别的一个重要实际应用,研究人体姿态识别方法可以对该实际问题提供借鉴。传统的人体姿态识别是以可见光
超短波电台检测设备校准装置是实现检测设备规范化校准、保障检测设备量值的准确可靠、构造标准化硬件平台的关键所在。本文依托于企业所承担的校准装置设备的研制任务,以校
序列信息时刻充斥着我们的生活,随着信息技术的发展,各个领域的序列信息也呈现了爆炸式的增长。在信息时代背景下,如何从这些序列信息中高效的找出对我们有用的信息,成为了序
箱型截面构件由于具有结构力学性能好、双向抗弯刚度大、自重轻等特点,在工业建筑中应用越来越广泛,一些大型建筑企业已基本形成了较为标准的制作工艺,主要涉及下料、组对、焊接,端铣等步骤,常规采用的焊接方法有气保焊,埋弧自动焊和电渣焊。但在核电钢结构的制作上电渣焊技术尚未被应用过,而国际核安全原则中明确要求核电必须采用经过验证的技术。XX公司在一核电项目建设过程中,有一箱型钢结构的制作任务,箱型钢结构内隔
心率是心脏每分钟跳动的次数,心率检测也是评估心脏健康状况的重要手段。已有的心率检测分为接触式和非接触式,其中接触式心率检测精度较高,但需要与皮肤接触、并且使用复杂
相位梯度超表面(Phase gradient metasurface)是由周期性或准周期性亚波长微结构单元阵列组成的新型人工电磁材料。它通过改变子单元结构来控制反射和透射波的相位突变量,在
复句关系词是连接复句分句的桥梁,是研究汉语复句的切入点。对复句关系词自动识别的前提是对汉语复句进行正确的分词,而复句关系词切分消歧是复句关系词自动识别的基础。目前