基于域名文本特征的恶意域名检测方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:LOVEmayicomein
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,不断增加的僵尸网络给政府、能源、制造等涉及隐私关键信息的领域带来严重威胁。僵尸主机和命令与控制(Command and Control,C&C)服务器的稳定连接是僵尸网络发起攻击的前提。为实现这种稳定连接,当前僵尸网络控制者广泛应用域名生成算法(Domain Generation Algorithm,DGA)来生成恶意域名。因此,提高DGA域名的检测性能是封堵僵尸网络和维护网络空间安全的关键。依赖特征工程的机器学习检测方法在一定程度上提高了检测的有效性,但其特征集的构建需要人工提取,且提取的特征范围相对固定,难以应对动态变化的DGA域名。相比之下,基于深度学习的检测方法能够自动提取域名特征,进一步提高检测效果,但其仍存在两个亟需解决的问题,一是对于类似于短文本的DGA域名,现有模型对其文本信息的利用能力和提取能力不高,在多分类性能上表现不佳;二是新型DGA域名家族层出不穷,特别是基于单词字典的DGA域名,其字符随机性低,与良性域名在字符分布和组成上十分相似,现有检测方法对其检测和分类效果不佳。鉴于此,本文的工作围绕提高DGA域名分类性能和提高基于单词字典的DGA域名检测性能作进一步研究,主要研究内容分为三部分:(1)恶意软件根据攻击对象的不同通常会采用不同的DGA,为了帮助网络管理人员快速精准地阻断攻击行为,提高检测模型的分类性能尤为重要。本文提出一种融合注意力机制与并行混合网络的DGA域名检测方法。为了提高域名信息利用率和提取域名深层特征,该方法的特征提取模块由DPCNN-SE网络和Bi LSTM-SA网络分别提取域名的深层空间语义特征和时序依赖特征,分别结合通道注意力机制和自注意力机制为提取的特征分配权重。实验结果表明:该方法在多分类任务中,准确率达到了0.9618;与四种对比模型相比,该方法在25个DGA域名家族具体分类结果上有21个家族的F1值最高,证明了其在检测性能和多分类性能的有效性。(2)针对常用检测方法对单词DGA域名检测和分类效果不佳的问题,本文分析了这类域名与良性域名在Unigram、Bigram、Trigram分布特性上的差异,设计了一种基于Bigram分词和词向量的域名数据嵌入方法。该方法同时保留了域名单字符特征和2-gram字符组合规律,使模型的输入具备更丰富的域名特征,有助于提高特征提取模块的训练效果。实验结果表明,在字符嵌入层采用Bigram分词和词向量化的方法能够提高模型的收敛速度,同时提高了模型的检测性能。(3)词根、词缀是区分不同单词的关键层级特征。为了精准捕获单词层级语义信息和单词字符间的构词规律,本文结合Bigram分词方法提出一种基于ON-LSTM与自注意力机制的单词DGA域名检测方法,该方法将有序神经元整合到LSTM中,构建了ON-LSTM-SA域名特征提取模块,有针对性地捕获单词关键层级信息,并为其分配权重。实验结果表明,该方法对Gozi、Matsnu、Nymaim、Suppobox四种常见的单词DGA域名的多分类F1值分别达到了0.95、0.96、0.92、0.98,实现了单词DGA域名的有效检测和分类。
其他文献
2021年1月,国家体育总局武术运动管理中心提出了“武术兵道”的新概念,是我国武术持械类格斗技术在实现民族传统体育文化创造性转化、创新性发展道路上迈出的重要一步。武术兵道无疑是中国武术的重要组成部分,短兵作为武术兵道中的一个子项目,不仅是中国武术重要的竞技形式之一,更是印刻着中国传统文化的重要载体。因此,在倡导文化自信和体育强国建设的时代背景下,本文试图通过对短兵项目过去40余年经验的梳理和总结,
学位
户外建构区是幼儿构造与表征的重要场所,其中的单元积木是幼儿园建构区中的常见材料。由于幼儿园对户外建构区环境的创设以保障基础条件为主,缺乏对环境与幼儿积木游戏相互影响的深刻认识,使得幼儿无法深入探究单元积木蕴含的构造和表征特性,教师对幼儿积木游戏的分析解读也把握不准。基于此确定以下研究目的:第一,经过到教育现场观察和访谈了解户外建构区的环境现状,以及区域内教师和幼儿活动状况。第二,结合环境现状和马赛
学位
党和国家非常关心少儿的体质健康,增强少儿体质健康水平是建设健康中国的重要方面。良好的身体素质是确保体质健康水平的物质基础,但近些年我国少儿的身体素质呈现出逐步下降的趋势。身体协调能力与体育学习兴趣分别是发展少儿身体素质的“关键点”与“加速剂”,而花样跳绳作为一项耗时少、耗能大的传统体育特色项目,对发展少儿身体协调能力、培养体育学习兴趣,以及增强身体素质有着不可或缺的促进效果。本研究主要采用文献资料
学位
弗吉尼亚作为英国在北美建立的第一块殖民地,在所有英属北美殖民地中颇具象征性。它不仅开创了美国政制体制的基石——代议制,还是美国大陆会议的发源地,在美国的后续发展过程中一直扮演着积极的“开拓者”的角色。而1776年在乔治·梅森领导下起草通过的《弗吉尼亚权利法案》,更是在美国历史上具有重要的地位和作用——它曾是其他13个殖民地权利法案、美国联邦宪法乃至法国《人权与公民权利宣言》制定时参照的范本,被誉为
学位
学前期是幼儿亲社会行为形成的关键期,幼儿的社会性出现新的需要,特别是4-5岁幼儿,心理发展水平出现较大跨越,更加渴望被集体认可和接纳,需要教师加以引导,更应该重视其亲社会行为的培养。分享行为的培养则是有效促进其亲社会行为的重要途径,图画书内容丰富、情节生动,这种图文并茂的讲述方式符合学前儿童的认知水平与年龄特征,深受学前儿童的喜爱,运用图画书开展教学活动更容易契合儿童的兴趣,促进社会性及亲社会行为
学位
研究目的:线粒体是真核生物细胞重要的细胞器,代谢改变或环境变化会造成线粒体内未折叠、错误折叠的蛋白质大量积累,从而启动线粒体未折叠蛋白反应(UPRmt)。UPRmt的激活增强了线粒体的蛋白稳态,保护线粒体免受进一步的损伤,并且具有促进缺陷线粒体恢复和再生等作用。研究显示,表观遗传修饰在线粒体UPRmt中发挥重要作用,哺乳动物中组蛋白赖氨酸去甲基化酶JMJD3、PHF8与UPRmt相关基因的甲基化状
学位
《活着》秉承了一贯的悲剧性创作风格,应从更为宽泛的视角来审视其浓重的悲情色彩。本文笔者尝试从更为宽泛的视角来重新审视《活着》这部作品的悲情色彩,从社会、历史等更为深刻的视角来揭示主人公福贵悲剧一生的必然性,在此之前的许多研究都将福贵悲剧性的一生归为命运和性格的偶然性缘由,其实命运和性格的悲剧只是这部作品的悲情表色,历史与社会的悲剧才是整部作品的悲情底色。
期刊
随着时代不断的进步与发展,课程改革也在不断地扩展与深入,语文作为基础课程,自然成为了教育改革的重点。中华人民共和国教育部制定的《义务教育语文课程标准》(2011年版)明确指出语言文字是人类最重要的交际工具和信息载体,是人类文化重要的组成部分,语文课程致力于培养学生的语言文字运用能力,提升学生的综合素养,为学好其他课程打下基础。也正因如此,语文学科已经受到了越来越多的学者关注。习作书面评语又是语文教
学位
“中国—中亚—西亚经济走廊”是“一带一路”倡议的六大经济走廊之一,是丝绸之路经济带的重要组成部分。作为一条以能源合作为主轴的“能源大通道”,“中国—中亚—西亚经济走廊”的安全建设对推动沿线国家共同发展繁荣具有重大意义。然而,沿线中亚、西亚地区存在错综复杂的地缘矛盾,导致暴力恐怖袭击事件泛滥。新冠肺炎疫情发生后,恐怖组织借机掀起新一波恐怖浪潮,严重威胁经济走廊建设发展。因此,研究“中国—中亚—西亚经
学位
绘本阅读是小学生英语学习的重要组成部分。随着多元文化的渗透以及现代教育技术的发展,在绘本教学中,多模态的使用越来越频繁,多模态的教学方式与绘本教学具有高度的适切性。本研究依据多模态教学理论和视觉语法理论,综合运用课堂教学观察、多模态话语分析和深度访谈等方法,对小学英语绘本教学展开了系统分析,探究当前小学英语绘本教学中多模态的应用情况以及在绘本教学中如何有效使用多模态等问题。结合对一线小学英语教师的
学位