基于非平衡数据的加密流量恶意性检测研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xiang879154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技发展,人们生活离不开网络活动。为了保护用户的隐私不被侵害,通过加密等手段可以将流量数据进行加密传输,提高信息保密性。但恶意活动通过采用TLS加密数据,使得其特征不易被识别。本研究的研究目的是检测隐藏在加密流量中的恶意活动产生的流量。并针对由加密流量数据不平衡导致的恶意加密流量漏过检测问题给出解法。同时,在解决非平衡问题的基础上,解决加密流量特征随时间变化导致检测效率降低的问题。目前,有研究工作采用机器学习算法训练分类模型,用于加密流量的恶意性检测,并取得一定的检测效果。本研究方法通过自动化采集流量,提取具有强区分度的加密流量特征。在基于恶意加密流量检测领域采用的流量特征基础上,对TLS握手过程的流量数据进行分析,发现TLS状态转移特征对分类良性/恶意加密流量是有效的。在现实环境下,用户进行的正常网络操作远多于恶意活动攻击用户并造成的异常操作。因此,造成网络中的良性加密流量远多于恶意加密流量的数据非平衡问题。在机器学习领域,处理非平衡数据是一个开放性问题。非平衡数据训练模型容易导致分类偏向多数类,导致模型的检测效率降低,使得恶意加密流量被分类为良性加密流量从而漏过检测。为了解决这个问题,本研究通过(1)基于代价敏感的CSRF算法和AdaCost算法训练模型,根据经验与实验分析,找到检测效率最优的代价因子比值CW以及倍数因子K。(2)基于过采样/欠采样技术平衡数据集,并采用随机森林算法训练分类模型用于加密流量分类。(3)基于单类学习的one-class SVM算法训练检测模型。经实验表明,代价因子比CW设置为17:1时,倍数因子K设置为1.45时,模型检测性能优于随机森林算法以及AdaBoost算法。本文的方法对比Anderson等通过实验认为最优的随机森林算法,对处理非平衡的加密流量具有更好的表现。实验得到的最优精度、AUC和GMEAN值分别为99.9903%、99.8032%、22.4567%。由于网络流量具有数量大,变化快的特点。采用离线学习的方式训练模型有不能及时更新的问题,导致检测效率容易随时间变化降低。为解决该问题,本研究通过采用霍夫丁自适应树(HAT)训练基于流的自适应学习模型,避免模型的检测效率受时间影响降低。并且,依据解决加密流量非平衡问题的结论,采用检测效率最优的代价因子比值CW调整自适应随机森林(ARF)算法。最优性能下,HAT模型精度在一段时间内均值达到98.36%,Kappa均值达到90.26%。ARF模型精度在一段时间内均值达到99.44%,Kappa均值达到96.62%,优于HAT模型的检测效率。此外,本研究设计用于加密流量恶意性检测的CiphTraffic框架。通过应用该框架各部分模块,实现基于非平衡数据的恶意加密流量检测的目的。并将CiphTraffic系统框架部署在现实场景下,用于对真实环境的加密流量进行检测,发现加密流量中存在的恶意活动痕迹,并定位到出现异常的主机。本研究工作对现有恶意加密流量检测效率进行提升,并解决了非平衡加密流量数据以及加密流量特征变化带来的分类不准的问题。对于检测隐藏在加密流量中的恶意活动、保护网络环境具有一定的意义。
其他文献
刘咸炘是晚清民国四川著名学者、经史学家。著有《推十书》将他毕生研究内容收入其中。《推十书》中撰有《<春秋>平论》《<儒行>本义》《<中庸>述义》等多篇经学论著研究成果,其中也蕴含着刘咸炘的经学思想和解经特点。论文对刘咸炘经学论著做进一步研究,希望能够对其经学方面的思想和成就做进一步了解。刘咸炘的经学思想来源主要有三个原因:一是刘咸炘家学渊源深厚,继承其祖父刘沅的经学思想;二是私淑章学诚“六经皆史”
学位
目的:通过BST-Ⅰ型激波管靶向致伤动物头部构建大鼠颅脑爆震伤(bTBI)模型;检测大鼠致伤后早期的生命体征、行为学、形态学等改变,与bTBI临床病例及以往的研究进行对比,验证bTBI模型是否构建成功;最后利用构建的bTBI模型探讨大鼠bTBI早期是否启动神经元焦亡的发生及其可能的机制。方法:(1)大鼠bTBI模型的建立:选取SD雄性大鼠42只,按随机数字表法分为空白对照组和实验组。实验组按致伤参
学位
如今,随着体育旅游的盛行,其重要性不容小觑,如在国内举办的成都大运会、北京冬奥会、西安全运会等,均得到了人们的大量关注。因此,有关体育赛事的各项因素也成为学者们的研究方向,例如怎样改善体育赛事的事件因素,如赛事场地、类型、地点等,以及体育赛事主办城市的拉动因素,如举办地的区位、景点等来吸引更多的观众或参赛者积极参与。尽管体育赛事在旅游领域中的研究广泛,但关于体育赛事宣传内容对消费者对赛事评价的影响
学位
近年来,基层治理问题,尤其是乡村治理问题成为热点研究话题。我国的乡村基层治理模式也一直在不断的调整和变迁,以前的“城乡双轨制”,“皇权不下乡”等现象代表着不同历史阶段的乡村发展和治理模式,以及基层治理特色。党的十八届三中全会上不断强调国家治理体系和治理能力现代化这一内容,而基层治理现代化便是国家治理现代化一个非常重要的组成板块。响应国家号召的前提下,各级地方政府按照全面深化改革的目标,对农村基层治
学位
进入21世纪以来,突发性的疫情事件获得了国际的普遍关注,尤为突出的是传染性疫情的关注度。在2003年、2004年、2005年、2010年、2014年、2019年爆发的SARS病毒、国际禽流感、H1N1流感、埃博拉病毒、新冠状病毒等,均对社会产生重大影响,直接影响国家的稳定发展,危害巨大。在中国,公安机关是应对突发公共卫生事件的主体,是第一力量要素。但在真实的工作过程中,公安机关面对严峻的社会发展形
学位
中职教师是完善职业教育体系的重要人力资源,中职教师为学生传授技能的同时,也会引导学生成长为社会需要的人才。因此,中职教师在中职教育发展中起着重要作用。但是,中职教师面临的工作压力较大,容易产生各类心理问题,并引起职业倦怠。而加强中职学校行政管理效能建设是建立现代中职教育学校的基础,在这过程中,需要面对中职教师的职业压力、职业倦怠等问题对中职学校行政管理效能的影响。因此,深入分析中职教师工作压力、心
学位
研究目的:举重项目是我国的优势项目和奥运会的重点项目,整体水平较强,我国女子举重项目虽然起步较晚但发展迅速,在国际上有很高的影响力。近年来陕西省优秀女子运动员陈桂明在国际举重赛场上挺举成绩连连打破世界纪录,而抓举的成绩在过去一年多的时间里并没有明显的提高。在举重赛场上,优胜劣汰,运动员们都在不断提高自己的竞技水平。且当下世界各国都在着重发展举重项目,随着国外举重项目实力的不断增强,我国举重项目的优
学位
金属3D打印技术是当下最前沿的增材制造技术,也是最具潜力的金属制造技术。目前主要的金属3D打印技术包括了:选择性激光烧结、选区激光熔融、电子束融化等,其主要以高能激光和电子束作为热源,达到沉积金属粉末成型零件的目的,但是这些技术存在着设备成本昂贵,打印条件苛刻等缺点。本课题针对当下金属3D打印的不足,制备了一种基于熔融沉积成型技术(FDM)的铜粉高分子复合丝材,并研究其打印和脱脂烧结工艺,以此降低
学位
在国内外大型赛事带动以及国家政策支持的影响下,大众的运动习惯逐渐养成,中国运动健身行业发展迅猛,2022年北京冬奥会的顺利举行更是将全民健身带向高潮。目前,健身房已经成为满足消费者的自我改善、人际交往等需求的重要生活场景,健身行业的市场竞争也越来越激烈。随着互联网在健身行业的深入应用,海量的用户数据得以存储下来,通过对这些数据的分析和挖掘,提前识别那些存在流失倾向的用户,管理者可以及时做出反应,通
学位
随着“万物互联”时代的到来,物联网设备产生的信息也呈现爆炸式的增长。云计算凭借其强大的计算能力以及按需收费等特点,在处理海量数据等方面一直备受青睐。然而云计算带来的高时延,无法提供即时性和移动性的支持等问题对于智慧交通等移动场景下的网络来说是不可取的。因此雾计算被引入到网络边缘的计算密集型应用中。相比于云计算,雾计算更呈分布式,它强调的是雾节点的数量和位置而非计算能力。雾计算在减少计算延迟的同时,
学位