基于DNS离线应答流量的恶意域名检测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:dalianwaiguoyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
域名系统(Domain Name System,DNS,以下简称DNS)是最重要的互联网基础设施之一,许多互联网应用都依赖于DNS提供的正常解析服务才能有效运行。以往的研究表明,在无需考虑具体通信控制协议情况下,基于DNS协议流量数据,可对木马软件、僵尸网络、勒索程序等恶意软件所使用的恶意域名进行有效的检测识别。检出的恶意域名不仅可以作为跟踪恶意软件通信行为的线索,也可为采取进一步防御措施提供高效的参数。本文构建了一个恶意域名的检测模型。首先,基于离线DNS应答流量,本文利用解析程序提取离线包中的资源记录,并建立带有可视化查询接口的数据库。其次,通过搜集互联网安全厂商、安全研究机构等组织发布的域名与IP地址的黑、白名单,本文构造出实验所需样本数据集。依托于该数据库和样本集,本文先从概率模型角度,在实验中对支持向量机和随机森林算法的恶意域名检测效果开展对比研究。根据实验结果评估两者的综合效能,并将性能较优者作为识别手段应用于实际检测。然后从概率图模型的角度,本文在由样本集构建的概率图上,应用置信度传播算法,根据置信度阈值检测恶意域名。最后,本文将两种方法适当结合,对真实环境下的离线DNS数据开展恶意域名检测,以验证模型的实际工程效果。与以往的研究相比,本文在应用机器学习算法的过程中,对域名开展的特征工程加入了网络安全领域的经验知识,并对特征进行了适当的编码量化。相比于其他研究所使用的样本而言,本文采集的样本缺乏时间性的相关特征。但即使如此,实验对恶意域名的检测,仍然取得了相当良好的效果:平均精确率达91%,召回率不低于90%。实验结果在接受机操作特征曲线(receiver operating characteristic curve,以下简称ROC曲线)中,曲线下面积(Area Under Curve,以下简称AUC)达到0.97,证明泛化检测指标良好。同时,在真实的离线流量中,本文的模型利用两种检测方式进行迭代识别测试,恶意域名检出率可以从单一检测方式的27%提高到37%。该结果表明,本文提出的模型工程化后,可在大规模离线数据环境下,以恶意域名的检出作为线索,发现恶意软件通信活动的一种可行解决方案。
其他文献
本文设计了一种山药清洗、分拣、切段、去皮全自动生产线的机械结构以及控制系统。该机器由清洗系统、分拣系统、切断系 统以及去皮系统组成。清洗系统通过电机、变速器、毛
合同管理属于企业业务管理工作的重要组成部分,但在实际合同管理中的合同订立、履行、变更、撤销、转让及终止等都面临相应的法律风险。常见风险主要表现为忽略对方信用审查
机组汽泵密封水多级水封频繁出现多种问题,任何一种问题的出现都会影响系统的安全运行,必须加大对汽泵与密封水的研究力度,采取科学有效的解决措施,减少问题的干扰。文章分析
随着市场经济的发展,软包装企业开展更有效的核算管理工作已是大势所趋,企业成本核算管理对其发展具有重要影响.软包装企业的市场依赖性较强,对原材料的需求也较大,这就导致
近些年来,我国的科学技术水平不断提高,社会经济迅猛发展,水利工程的建设规模也在逐年扩大,水利工程得到了较好发展。水利工程的施工质量是工程的基础,它与人们的生命安全息息相关
随着绿色经济在中国的蓬勃发展,天然气行业正面临着前所未有的发展机遇.作为天然气行业主营业务之一的燃气工程业务,往往由于工程项目数量多、业务流程长、信息化水平低等原
文章归纳了“三助一辅”德育功能的内涵与特点,分析了地方高校研究生“三助一辅”德育功能实现面临的困难,并对地方高校如何充分发挥“三助一辅”德育功能进行了探讨。
人多地少是我国的基本国情,耕地逐年减少是每一个国人都应该关注的问题。本文主要从国有土地产权制度和集体土地产权制度两方面进行具体分析,指出耕地问题出现的根源主要是土地
长期以来我国经济的发展忽视了对环境的保护,以牺牲环境来换取经济的快速发展,我国林业资源存在过度开发的问题,不仅导致土地沙化严重,而且全球气候变暖,给人类的生存带来了
电子天平是当前广泛使用的称量衡具之一,在工农业生产、科学研究、医疗卫生乃至人们的日常生活中都有着十分广泛的应用。电子天平采用现代电子技术、传感器技术,对称量对象进行称量作业,具有远超传统机械天平的易用性、工作效率和测量精度。由于电子天平内部元器件精度很高,为了保障作业精度,每隔一段时间就要对电子天平进行检定和校验,消除缺陷和不标准的问题。文章围绕电子天平检定和校验有关问题进行探讨,阐述了电子天平的