正则表达式高速匹配的硬件加速引擎研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lzjsja
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正则表达式被用来进行字符串的查找,匹配,其应用的情形十分广泛,如网络入侵检测,生物DNA序列,金融数据风控等。随着物联网发展,5G技术的出现,生活中产生的数据快速增多,大约每过两年这些数据就会提高到原来的两倍。在这种情况下,基于传统中央处理器(Central Processing Unit,简称CPU)的软件方案实现的正则表达式匹配引擎的匹配速度早已不能满足实际需求,导致大量数据荒废。基于上述的背景下,本文主要对正则表达式硬件实现的非确定有限自动机(Nondeterministic Finite Automaton,简称NFA)算法进行了研究分析。得到的结论如下,以往的硬件引擎已经实现一个时钟周期处理一个字符的最快逻辑速度,其对数据流的实际处理速度只能通过最大时钟频率的提高来提升。但是它们的实用性较低,需要进行重复开发,使用分散的比较器,资源利用率低。在这一基础上,文章从两个研究点分别研究,即需求高时钟频率的实现方案和不需要重复开发的实现方案。文章将NFA算法和状态机思想进行了比较,通过探究实验,得出可以使用状态机的思想来实现正则表达式硬件匹配引擎的思路。随后,将正则表达式分成几个基本类型和混合类型,逐一通过Verilog代码进行实现,得到了一套针对基本元字符的“状态机实现引擎方案”。此外,文章在资源和可重构的导向上完成了一个硬件引擎的设计即“可重构引擎方案”,根据正则表达式的特点设计了一种指令格式,通过指令配置电路实现“双重复用”的电路设计。“状态机实现引擎方案”通过输入测试,得到结果可以满足设计要求,并且速度很快,一个字符消耗一个周期,使用现场可编程逻辑门电路(Field Programmable Gate Array,简称FPGA)最大时钟频率可达800MHz,即吞吐率6.4Gbps,较同类型研究有1-2倍速度提升,缺点是需要重复开发。“可重构引擎方案”对子模块和顶层分别进行测试,也达到了设计的匹配要求,在未触发匹配时一个字符消耗一个周期,触发匹配时消耗5到8个周期,由于未触发匹配占绝大多数的操作时间,故速度大致接近一个字符消耗一个周期。架构实现双重复用电路的情况下,只使用了三个比较器,并且综合报告资源消耗为355个逻辑单元(Logic Elements,简称LE)。相比以往的堆叠式设计消耗大量的LE,有着明显的优势,同时不需要重复开发。
其他文献
学位
学位
学位
学位
学位
随着大数据时代的来临,统计在我们生活中无处不在,提高全民统计素养已成为了各国普及概率统计教育的宗旨,重视统计内容和开展统计教学已经成为当下社会发展的必然趋势。方差是描述性统计中非常重要的差异量指标,并且在推断统计中也有广泛的应用,所以深入了解学生对于方差概念的理解现状是很有必要的。本研究的研究问题主要有三个:第一,九年级学生对方差概念是如何理解的?是否会计算方差?第二,在不计算方差的情况下,学生如
学位
随着我国经济的快速稳定增长,上市公司这一主体在资本市场中的重要地位日渐彰显,上市公司走入财务困境时,如若不能及时化解,对自身、资本市场、所在区域的繁荣和人口就业都会造成较大的冲击。因此研究财务困境问题,分析财务困境的治理机制,帮助企业防范财务风险将具有重要现实意义。关于财务困境方面的学术研究,虽然已经有文献从企业外部环境和治理、高管个人背景、心理特征等对其影响因素进行了探索,但尚无文献从高管的家庭
教育是情感的实践,教师在教育教学的过程中需要进行大量的情绪劳动,这是教师工作中的重要方面。我国的教师情绪劳动研究刚刚起步,已有研究多集中在本土化量表的编制和各学段教师情绪劳动的整体性特征研究上,缺乏对教师细分群体的考察,以中学各学科教师作为研究对象的实证研究鲜少。本研究聚焦中学英语教师情绪劳动的现状及相关影响因素,在前人的理论和实证研究基础上构建出包括教师情绪规则认知、情绪劳动策略使用和教学情绪感
当前,社会发展和教育改革对学校科学化管理、高质量教育服务提出了更高要求,培养教育家型、专业型、创新型学校领导成为了新时代校级领导队伍建设的关键任务,而队伍建设的重点是提升校级领导岗位胜任力。以胜任力为切入点强化校级领导的遴选、聘用、培养与评价,实现教育质量与办学水平的提升,是当前教育界需要着力解决的重要课题。本研究重点指向基础教育校级领导胜任力现状全面深入的调查研究,在此基础上从内外部、干部自身和