网络安全领域实体关系抽取模型研究及FPGA实现方案

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:chaoyue0130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年随着人工智能的迅速发展,基于神经网络的网络安全应用也引起学术界和产业的广泛关注,实体关系抽取能从网络安全文本数据中提取和挖掘有价值的信息,分析其关联关系,从而提升网络安全事件的分析能力。现有大部分面向实体抽取的神经网络模型主要通过软件的方式实现,为了提高实时性,满足网络安全某些特定场景的应用,需要研究基于神经网络的网络安全应用的硬件实现。目前,大多数深度学习应用程序都基于通用处理器GPU,但GPU并不是针对机器学习设计的,而且成本、功耗较高,灵活性较差。另一方面,FPGA可重复配置以及存在高并行结构适合于神经网络模型实现,其灵活性、稳定性、安全性都很高,而且能耗比远好于GPU,因此基于FPGA实现神经网络模型成为学术界和产业界的研究方向。本文主要围绕网络安全领域的实体关系抽取模型及其基于FPGA的实现方案展开研究,由于项目分工和时间关系,主要集中在前面部分的研究,具体的工作如下:第一,设计了网络安全领域实体关系类型。我们广泛参考了结构化威胁情报表达STIX2.0和统一网络安全实体UCO2.0并结合了实际的网络安全文本实体关系类别构建了8类网络安全领域实体关系类型。第二,提出了面向网络安全领域的Dense PCNN-ATT实体关系抽取模型。该模型主要针对目前主流的PCNN模型存在的问题引入了密集连接网络,最大化加强特征复用,从而提升实体关系抽取效果。并针对可能出现的过拟合问题,采用L2正则化和Dropout防止过拟合问题。在GPU上对实体关系抽取模型进行了高效内存实现,并通过对比实验验证了本文提出的模型在通用领域和网络安全数据集上都能取得较高的准确率。第三,构建网络安全领域数据集。针对网络安全领域数据集较为稀少的问题,本文通过爬虫自动化爬取收集安全文本语料,并进行清洗、过滤等操作,然后通过远程监督学习对文本数据进行自动标注,生成初始标注数据集,通过人工校验系统,过滤标记错误的示例,得到最终的数据集。构建了大约5千条标注好的语料训练数据。第四,基于FPGA对简单的网络安全领域实体关系抽取模型的卷积和池化模块、激活函数、模型实现总体框架以及计算时间和效能测试的实验方案进行了设计。
其他文献
学位
股权激励起源于20世纪60年代,是用以解决代理问题、有效预防公司经营中短视行为、促进企业可持续发展的一种重要机制。股权激励作为一种长期性的激励手段,通过授予一定数额的股票,促使企业员工与所有者利益相一致,从而达到提升企业价值的效果。由于企业在不同的生命周期阶段表现出的差异性,有必要结合各个时期的特点设计与之相匹配的股权激励方案。本文以医药制造业行业为研究对象,首先从各个基本要素对医药制造业实施股权
近年来,我国经济增长放缓,金融部门快速扩张而实体部门却发展受限,在此背景之下,我国企业开始偏离主业进行其他投资,许多资金被停留在收益更好的金融部门中,没有起到服务实体经济发展的本质功能,呈现出“脱实向虚”的趋势。从微观企业的角度,企业金融化问题实际上是企业对于实业投资和金融资产投资的选择问题,部分学者认为在企业资源有限的情况下,企业金融化行为必然会挤占企业创新资源,但实际上,企业金融化对企业创新既
随着我国经济文化的蓬勃发展,高等教育发展从精英化走向普及化,教育模式由单一化走向多元化,促进了“第二课堂”——高校学生活动中心此类校园建筑的蓬勃发展,引发了学术界的持续关注,关于学生活动中心的建筑设计也逐渐走向精细化。高校学生活动中心此类建筑功能并没有统一标准,亦无相关设计规范,其存在的意义即为广大师生提供交往场所。针对学生活动中心入口空间,由于活动中心建筑本身的精细化发展趋势以及新时代学生活动的
三维相变存储器(3D PCM)采用交叉堆叠的方式保证优异存储性能的同时极大地提高了存储密度,成为最接近大规模产业化的下一代非易失性存储器。但随着阵列规模的不断增大,流经半选通单元的电流越来越大,带来了严重的信息误读、误操作以及电路功耗加大等问题。传统的晶体管因其三端结构和制备工艺难以实现三维堆叠,必须开发新型两端选通器件来抑制阵列漏电流,其中奥氏阈值开关(OTS)选通管因其高驱动能力和高热稳定性等
自1993年“宝延事件”事件至今,中国企业间的并购活动随着资本市场功能和相关法律的完善不断增加,于2015年达到顶峰,当年并购涉及交易金额15766.49亿元,企业整体价值的评估作为并购过程中非常重要的一个环节也愈受关注。企业整体价值,绝不是简单的各单项资产经公允价值评估后的资产价值和债务价值的加总,对企业价值的评估也不等同于对企业各单项资产的评估,而是对企业资产综合体的整体性、动态性的价值评估。
在大数据战略的推动下,大数据产业展现出巨大发展潜力,其关联带动效应明显,极大促进经济发展转型。而产业技术创新能力作为大数据产业的核心,与大数据产业的发展息息相关。由于我国技术创新能力整体实力较弱以及产业技术创新存在外部性,需要政府出台有效的产业政策带动产业技术创新展开。因此,研究贵州省大数据产业中相关政策对技术创新的影响效应,对促进贵州省大数据政策体系完善和大数据产业技术创新能力提升有一定借鉴意义
疏水疏油防污涂层是一种功能性涂层,能保持表面洁净,抵抗各种污迹。防污涂层的特点是表面能较低和交联密度较高。本论文在合成丙烯酸树脂水分散体(WPA)和具有较低表面能的有机硅改性丙烯酸树脂水分散体(WSPA)基础上,通过与氨基树脂交联,获得了具有疏水疏油防污功能的涂层。本论文以甲基丙烯酸甲酯(MMA)、甲基丙烯酸羟丙酯(HPMA)、丙烯酸丁酯(BA)、丙烯酸(AA)、甲基丙烯酸异冰片酯(IBOMA)作
随着多媒体应用的不断发展以及移动设备数量的快速增长,网络中的移动数据流量正以前所未有的速度增长。与此同时,研究表明网络中大部分的新增移动数据流量主要是由不同用户对一小部分相同内容的重复请求所贡献的。这意味着我们可以通过边缘缓存技术,将某些热点流行的内容缓存在离用户较近的网络边缘来减少重复传输,以此缓解网络流量拥塞,进一步降低用户获取所需内容的平均时延,提高用户体验质量。在此背景下,本文对基于机器学
传统化学印花行业的废水排放量大,工艺复杂,印花产品的品质不高。数码印花是一种新型印花技术,印花过程的上染率高且无废水产生,符合绿色化学的生产工艺,因此在近五年得到快速发展。纳米分散染料具有粒径小且墨水稳定性优的特点,可用于数码印花的喷墨打印,因此是数码印花的主要耗材。木质素分散剂具有天然绿色无毒的特点,满足数码印花墨水的助剂必须无毒无害的要求,因此广泛应用于纳米分散染料领域。然而,由于纳米分散染料