基于行为特征的可疑APT数据预处理和检测

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zhyjrr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高级持续性威胁(APT)这一典型的复杂网络攻击,因其针对性强、隐蔽性好以及破坏性大,逐渐引起人们的重视。学者们结合实际提出了恶意代码检测、异常流量检测、全流量回溯分析等诸多检测方法。已有的研究表明,对DNS数据进行检测,能够有效地发现网络流量中的异常,进而发现APT攻击。针对DNS数据处理问题,选取合理的DNS行为特征,通过正常行为特征来检测出所有合法域名,进而排除绝大多数的正常DNS数据,暴露可疑数据集,可以为进一步的APT攻击检测提供数据支持。本文提出一种利用DNS数据正常行为特征的数据处理方法,通过本方法能够有效区分可疑数据和正常数据。本方法包括数据预处理和数据检测两个步骤。数据预处理部分首先对原始DNS数据进行处理,使用白名单、访问主机数、单位时间内总访问次数这3项规则进行数据缩减。数据检测部分对经过数据预处理后的数据进行特征提取和可疑数据检测。使用域名解析正确率、IP地址相似率等8项正常行为特征对数据进行特征量化,计算出数据的各项特征值。然后,利用机器学习中的孤立森林算法对数据进行了检测,通过对比设定的阈值,区分出了待检测数据集中的正常DNS数据和含有仿真攻击的数据集。本文利用大量真实DNS数据对所提出的检测方法进行了实验。首先,使用本文所提出的数据预处理方法,筛除了原始数据集中91.8%的数据,实现了检测数据的大规模压缩。采用数据模拟的方法对检测方法进行验证,在经压缩后的数据中加入了仿真攻击数据,形成了包含仿真攻击数据的DNS流量数据集。使用孤立森林算法对数据集检测后,本方法检测可疑数据的假正例率为0.68%,查准率为99.9%,检测率为99.85%。所使用的8项数据特征中,有4项是本文所提出的、新的数据特征。为了衡量这4项新数据特征的检测效果,进行了对比实验,结果显示本文提出的4项新特征对整体的检测效果具有一定的影响,能够帮助算法更加准确地检测数据,去除这4项特征的检测效果在假正例率方面有所上升。本文所提出的方法通过大幅度缩减数据规模,提高了整体检测性能,有效解决原始数据量特别庞大的问题。所提出的应用于机器学习算法的数据特征,能够提高机器学习算法检测可疑数据的准确性。实验结果表明,本方法能够有效地区分出正常数据集和可疑数据集。本文所提出的方法既可以独立使用,有效筛查可疑DNS数据集;又可以作为其他异常检测方法的补充,共同进行检测;还可以作为相关研究侦测的前端数据处理部分,为今后APT攻击研究提供良好的数据处理平台,并提升研究和检测效率。
其他文献
地铁轴流风机作为排烟、送风的专用工具,对乘客的生命安全、财产安全和保障地铁可以正常的运行来说具有极其重要的作用,其健康状态直接关乎地铁安全运营。基本处于全天候工作状态的地铁轴流风机,在位于地下密闭空间的地铁中运行时有很多安全隐患。若是风机在带故障的状态下工作,地铁环控系统运行出现问题会使整个系统运行出现瘫痪,严重会使车控室停机。保证这些风机设备的安全运行是维护地铁环控系统稳定的前提和基础,更关系到
最近几年,移动通信网络技术与互联网络技术发展迅速,以智能手机为首的智能移动终端已经走进千家万户。特别是在教育领域,移动学习由于科技的发展越来越成为现代人的新型学习
<正>自上世纪90年代中期,北京地区开始实行住院医师规范化培训工作,培训基地的主体是多家综合性三甲医院,培训的口腔医师总数已经超过口腔专科医院,他们在口腔住院医师的培养
随着直播技术的兴起与普及,网络直播呈井喷式发展,相应地,网络女主播也乘势而生。网络女主播凭借其外貌、性格等优势在直播浪潮中大放异彩。但与此同时,直播过程中游戏传播、
采用HH—S型数显恒温油浴锅和简易油浴锅对国家标准土壤样品进行样品消解对比试验。结果显示:两种样品前处理方法的测定结果,经t检验无显著差异;HH—S型数显恒温油浴锅消解进行
<正>近几年来,国际油价不断上涨,不可再生能源资源日益减少,石油能源危机即将来到。面对即将到来的能源危机,全世界都认识到必须采取开源节流的战略,即一方面节约能源,另一方
<正>新一代信息技术蓬勃发展,对统计提出了新的要求。本文通过对浙江"三新"经济范围界定、数据核算及基本结果的分析研究,初步揭示浙江经济发展中的新动能变化,提出完善"三新
由美国查塔姆公司近斯推出的合成无色钻石的色绿接近F,净度最高达SI1级,晶体主要由{111}、{100}、{211}单形组成聚形,{110}单形一般发育不全,晶面上发育有特征的被叶脉状生长花纹
<正>随着我国人民生活水平的不断提高,大型城市的综合性商业区、著名的旅游景点等区域往往会出现人群的"井喷"现象,特别是在节假日期间这种现象更为明显。人员逗留时间长,活
目的:神经病理性疼痛(Neuropathic pain,NP)是疼痛科日常诊疗中最常见的慢性疾病之一,它主要是指由于躯体感觉系统的损害或疾病所引起的疼痛,如神经系统的损伤、缺血、感染、代谢性疾病、神经受压等,使痛觉阈值大幅下降,继而因神经元兴奋性增强而出现异常的疼痛、自发性的疼痛、感觉异常和痛觉过敏等表现,严重影响患者的情绪及生活质量。因神经病理性疼痛的发病机制较为复杂(主要有功能受损和解剖结构改