基于深度学习的内部威胁检测方法研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:robert_xt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,内部威胁已成为破坏企业信息系统安全的重要隐患。内部威胁,指的是具有合法访问权限的个人对组织构成的伤害。当前检测内部威胁的方法主要分为浅层机器学习方法和深度学习方法。传统的浅层机器学习算法需要复杂的特征工程,并且在内部威胁检测的应用中也存在局限性。例如,隐马尔科夫不适合处理较长的行为序列,图聚类算法在处理海量数据时需要大量的内存消耗以及单类支持向量机在处理高维数据时效率较低等问题。因此,传统机器学习算法的局限性导致检测率的提升逐渐到达瓶颈。近几年,深度神经网络的发展给内部威胁检测问题带来了新思路。深度学习技术能够提取多层次的特征,充分揭示特征之间的内在联系。内部威胁检测的关键是建立用户的正常行为模型,继而发现与正常行为偏离的异常行为。用户行为可以看作长期的时间序列数据,长短时记忆网络展示了在简化特征工程的情况下学习长期序列模式的能力,因此可以发现内部用户行为中的隐含行为特征,大大提高检测率。然而目前的用户行为建模方法仍停留在单步时间序列预测,忽视了用户行为的随机性,往往容易造成误报。一些学者使用深度学习提取特征之后再应用浅层分类方法进行检测,这种混合检测方法不利于神经网络和分类器的参数优化。此外,一些内部威胁检测方法忽视了内部威胁检测的特殊性,没有充分利用公司不同角色的行为相似性。基于此,本文提出基于多步时间序列预测的用户行为建模方法,结合单类分类器进行联合训练实现深度单类分类器。并进一步结合用户元数据针对角色属性训练多个超球面,通过优化复合损失函数,进一步提高检测率。具体来说,可以分为以下三个方面的研究工作:(1)针对单步时间序列预测存在的误报问题,本文提出基于多步预测的行为建模方法,使用神经网络作为特征提取器,对用户长期行为特征建模。多步预测指的是根据当前的输入预测多个时间点的行为,即从一定数量的时间点计算预测误差,在训练过程中同时进行优化。此外,由于用户日常行为中浏览器访问行为占了绝大多数,本文针对用户行为类型的不均衡问题,提出基于批次的不均衡数据训练方法,在用户行为建模过程的每一个批次中修改每种类型行为的权值,使其在训练过程中占有相同的分量,实现对用户行为的全面刻画。实验结果显示,用户行为多步预测的准确率可以达到94%以上。(2)针对高维数据存在的稀疏性问题和混合检测方式的参数优化问题,本文在用户行为建模的基础上增加了池化降维的方法,并且提出联合训练深度单类分类器的方法,用于解决本课题的异常检测任务。在训练过程中,仿照卷积神经网络,通过添加池化层对不同位置的特征进行聚合统计达到降维的目的,解决了高维数据的稀疏性问题;由于神经网络和单类分类器的联合训练是以交替学习的方式动态更新这两部分的参数,充分利用了深度学习的优势,比分别单独训练的召回率提升了近13%。(3)针对内部威胁数据集的角色相关性,本文进一步提出基于角色的深度单类检测方法,结合用户元数据训练多个超球面,在网络的训练过程中既根据当前用户行为预测所属角色,同时又要使所有数据点向自己所属角色超球面尽可能的靠近。通过优化复合损失函数,进一步提升了约8%的召回率。在CERT内部用户行为数据集上的实验结果表明,基于长短时记忆网络的深度单类分类算法可用于识别内部威胁事件,在可接受的误报率范围内,召回率能达到92%,明显好于单类支持向量机和孤立森林算法。
其他文献
改革开放以来,我国经济发展飞速,在短短不到四十年的时间,一跃成为世界第二经济大国。其中,“消费”作为拉动经济发展的“三驾马车”之一,是保持经济社会持续健康发展的关键
柱面镜因其独特的线聚焦特性被广泛应用于强激光系统、扫描成像系统以及全息投影系统中。随着科学技术的不断发展,人们对柱面镜的精度及口径提出了更高的要求。对柱面镜进行精密检测时,通常需要一个与之口径相等或更大的标准柱面镜。然而,对于大口径或大孔径角柱面镜而言,正是因为它的非旋转对称特性使得高精度标准柱面镜制造困难且成本高。子孔径拼接技术采用“以小拼大”的原则,将被测面划分为数个互有重叠的子孔径进行逐一检
盐渍土是盐土和碱土以及各种盐化、碱化土壤的总称。目前世界上盐渍土分布广泛,处于盐渍土地区的建筑物和构筑物受到盐渍土危害影响很大,主要表现为盐胀和溶陷现象会导致建筑物和构筑物的地基变动甚至对其造成破坏。在高速铁路建设过程中,由于盐渍土本身具有的溶陷特性,会导致盐渍土地区的铁路路基浸水后发生沉降,而高速铁路对路基沉降量的要求很高,如无砟轨道的路基工后沉降量不宜超过15mm。随着高速铁路等基础设施在国内
空气污染问题已经成为当今世界最为严重的环境问题之一,细颗粒物(PM2.5)对空气的污染及对经济发展和人体健康造成危害尤为严重。本文以北京市为主要研究对象,分析2013年12月2
近年来,随着科学的进步和社会的发展,癌症的患病人数也在不断攀升,并且正趋于低龄化。癌症患儿治愈疾病需要较长一段时间的入院治疗,并面临着生理及心理方面的变化以及对环境的变化,这就有可能造成患儿的入院不适应,由于不适应导致各种问题再次加重患儿及家属的生理心理问题,从而造成一系列的恶性循环。笔者在上海某儿童医院血液科进行了为期半年的实习,开始关注并了解这个群体,患病儿童的年龄从几个月到十几岁不等,整个治
本文将介绍利用透射电子显微镜(TEM)与电子能量损失光谱(EELS)实现具有高空间分辨的磁手性二向色性谱(EMCD)方法,用以表征双钙钛矿中的复杂精细结构、化学成分与磁性间之关联性。对
随着互联网和移动终端设备的飞速发展,社交网络用户从被动消费内容方式向用户主动创建和分享内容方式转变。文本图片组合是社交网络常见的表达方式。如何从海量社交图片中快速找到适合用户生成内容的图片是一个挑战性的问题。论文以新浪微博和花瓣网为研究平台,针对用户生成的微博文本,分析其内容与情感表达,为用户生成适合的候选图片列表供用户选择。论文主要工作包括如下:1、面向中文情感词汇本体建立了一个大规模图像情感分
潮滩是在潮汐作用下形成由淤泥粉砂质沉积物组成的宽阔平坦的浅滩,以潮间滩涂为主,还包含潮上带及潮下带水下岸坡。黄河携带大量泥沙在三角洲近岸区堆积,在潮汐不断作用下形
未甲基化的胞嘧啶-磷酸-鸟嘌呤寡脱氧核糖核苷酸(CpG ODNs)佐剂自带免疫活性,可以仿细菌、病毒的病原体相关分子模式。而且其可以与抗原提呈细胞(APCs),如巨噬细胞、树突细胞(DCs)或B细胞中的Toll-like Receptor9(TLR-9)特异性结合,上调主要组织相容复合体(MHC)和共刺激分子,表达促炎症细胞因子,促进Th1免疫反应,诱导抗原特异性细胞毒性T淋巴细胞(CTLs)反应
黄淮平原长期以小麦-玉米为主要轮作方式,针对黄淮平原潮土区作物布局不合理和氮肥减施等问题,设置两个大田小区试验。试验1:设置小麦与豆科作物轮作3个处理:(1)小麦-玉米轮作、(2)小麦-夏花生轮作、(3)小麦-大豆轮作。试验2:设置小麦播量与氮肥不同水平交互4个处理:(1)小麦常规播量+常规施量肥(CBCF);(2)增播30%+常规施氮量(ZBCF);(3)增播30%+减氮20%(ZBJF);(4