基于深度学习的恶意域名检测方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:gl5458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了应对IP地址封锁和DNS沉洞,现代僵尸网络开始使用域名生成算法(DGA)来动态生成恶意域名,作为感染主机和控制者通信的集合点。对恶意域名进行检测能及时发现感染主机,保障用户上网安全,同时也有助于僵尸网络的追踪和溯源。现有的恶意域名检测方法仍然存在两点问题,一是无法有效检测基于单词表的DGA生成的恶意域名,二是检测模型可能会被对抗样本欺骗,模型的鲁棒性有待进一步分析。针对这些问题,本文开展了以下研究工作:(1)基于n-gram和word2vec对域名进行预处理。通过比较n-gram分布分析了恶意域名和良性域名的区别,发现随着n值的增大两者的字符组合差异越来越明显,这将有助于检测模型将它们区分开,因此基于n-gram对域名进行分词。然而n值太大时不仅会增加计算量,还会导致维度灾难,为了解决这个问题,根据齐夫定律确定了n的范围。随后使用word2vec工具在分词后的域名语料库上训练跳词模型,从而将域名转化为计算机能够处理的数值向量。(2)构建了基于注意力卷积网络的恶意域名检测模型。针对卷积神经网络的滑动窗口无法捕获长距离依赖的问题,引入了注意力机制,通过构造一个上下文向量来表示当前词和序列中其他词的联系,然后将输入向量和上下文向量一起送入卷积模块。为了充分提取域名的潜在特征,设计的卷积模块包含三个具有不同核大小的并行卷积层,每个卷积层之后紧跟一个最大池化层。实验结果表明,构建的检测模型对于三种基于单词表的DGA(gozi、matsnu、suppobox)生成的恶意域名的查全率分别达到了86.03%、88.31%、91.57%,同时整体检测效果相较于其他模型也有不同程度的提高。(3)对检测模型的鲁棒性进行了分析。为了评估模型的鲁棒性,提出了一种基于生成对抗网络的对抗攻击方法。该方法首先通过生成器和鉴别器的相互博弈学习一个与样本集合独立同分布的潜在空间,然后使用换流器将原始样本映射到潜在空间并添加干扰,最后由生成器生成对抗样本,由鉴别器保证对抗样本和原始样本的相似性。实验结果表明,四种基于深度学习的恶意域名检测模型都对生成的对抗样本表现出了脆弱性,平均查全率仅有51.16%。之后使用对抗样本增广训练集,通过对抗训练来增强模型的鲁棒性,将对抗样本的查全率提高到了85%以上,同时发现基于单词表的DGA生成的恶意域名的查全率也有小幅提高。
其他文献
近年来,随着激光基础理论和技术的不断发展,大功率(大能量)飞秒激光器在各个领域的基础研究和核心工业生产中已经得到了广泛的应用,例如微纳加工、超快测量、生物医学等。飞秒激光的主要研究方向可以分为低重复频率大能量飞秒激光和高重复频率高平均功率飞秒激光。前者已经比较成熟,而后者尚在起步阶段,特别是高重复频率高平均功率飞秒光纤激光的相关研究还很少。以双包层掺镱增益光纤(Yb-dopeddouble cla
残疾人群体就业问题,是一个世界性的难题。在各级人民政府和社会各界的努力与支持下,我国残疾人就业模式已经从集中就业为主的单一就业模式发展为集中就业、按比例分散就业与
本文合成了一种能与硅酸钾溶液具有良好相容性的高性能硅丙乳液,然后以此乳液作为有机成膜物质添加至无机硅酸钾溶液中,形成有机-无机杂化乳液,配以锌粉混合制备具有高附着力高柔韧性硅酸盐重防腐涂料。具体研究内容及结果如下:(1)通过单因素实验确定合成与硅酸钾溶液具有良好相容性的硅丙乳液的最佳工艺条件:聚合反应温度80~85℃,聚合反应时间3~4 h,搅拌速度200~300 r/min,软、硬单体质量比4:
随着互联网时代的日益发展,新兴知识的了解方式多样而便捷,由此,引发了“书、报”式的传统阅读方式的改变。新媒体作为科技的新型产物应运而生,并促进了出版社的网络发文阅读量的迅猛增长,推动了媒体平台的发展。然而庞大的阅读量增加了出版社网络维护人员的需求与工作量,因此一款以改变繁重的人力操作以实现半自动化管理的产品为社会所需。本文基于此设计并实现新媒体发文管理平台系统。新媒体发文管理平台系统是一款集多家发
改革开放四十余年来,我国农业农村发生翻天覆地的变化,于2020年我国即将全面建成小康社会。党管农村工作是党的一个传统,同时也是农业农村能够稳步发展的制度优势。在党的十九大上,乡村振兴战略作为新的历史方位下农业农村发展的新战略被提出。而乡村振兴的关键在于产业兴旺,农村一二三产业融合能够优化农业农村产业结构,形成产业发展最大合力,是产业兴旺的重要抓手。产业兴旺才能够为其他领域的振兴提供坚实的物质基础与
近年来,随着移动通信设备的增加和用户对数据传输速率要求的不断提升,业界提出在传统宏蜂窝网络的基础上布置大量的低功率小覆盖的微基站、毫微基站和毫微微基站等,构建异构网络,增强接入与回程容量,提高系统吞吐量,改善用户服务体验。对于传统的内容获取类应用而言,用户需要从核心网服务器获取内容,时延较高,数据传数量大。移动边缘缓存技术则是解决该问题的一种有效方案,将远端服务器的热点内容放置于基站等接入点中,拉
3月8日,自治区党委办公厅和政府办公厅联合下发通知,要求全区各级组织结合实际,认真贯彻落实自治区党委和政府新近出台的《关于完善农村土地所有权承包权经营权分置制度的实
本文探究木刻版画教学在伍家岗小学中的实践研究,笔者作为伍家岗小学的美术教师,将创新型木刻版画课程作为伍家岗小学的美术实验研究基地,文章围绕三个部分展开研究,第一部分
人致荷载的测定是研究人致振动舒适度的基础,由行走行为产生的步行力是一种典型的人致荷载,是引发人致结构振动舒适度问题的重要原因之一。为了研究楼面和楼梯上行走的人致结构振动问题,本文采用无线加速度传感系统测定步行力,开展了关于人步行及上下楼梯荷载的试验研究。具体研究内容如下:1、采用无线加速度传感系统测定楼面行走的步行力。介绍了试验的准备工作、操作过程和试验期间的注意事项。试验共测定了16名测试者在1
在机器学习、人工智能等新兴领域中,定制化CPU和硬件、按需协同软硬件设计,能极大提高应用程序的性能、效率和安全性。但定制化CPU如果缺少配套编译器的支持,就无法执行应用程序,即新芯无“魂”。因此如何快速地为其开发编译器,从而打通软硬件设施,具有十分重要的意义。目前大多数与编译器相关的研究多集中在优化上,但在为特定目标生成代码的后端领域,缺乏广泛地研究和应有的重视。因此,本课题对编译器后端移植技术进