基于机器学习的入侵检测方法研究

被引量 : 0次 | 上传用户:meimeini
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测技术是现代计算机系统安全技术中的重要组成部分,并且是当前的研究热点。目前,绝大多数入侵行为都通过攻击特权进程来破坏计算机系统的安全性。特权进程通常完成特定的、有限的行为,所以其行为在时间上和空间上比其他用户程序要更稳定。本文以入侵检测的核心技术检测模型为研究对象,以操作系统的系统调用为研究内容,以提高异常行为的识别能力、减少误警率为目标,从研究正常行为与异常行为的差异入手提出一个基于马尔科夫模型的入侵检测框架,在此基础上步步深入研究三个基于马尔科夫模型的异常检测模型。主要研究内容如下:(1)结合系统调用序列的特点,提出基于机器学习的入侵检测系统框架。入侵检测本质上是一个分类问题,而分类问题要以学习为前提。从机器学习所涉及到的一致性假设,划分与泛化能力三方面内容着手,详细分析了入侵检测系统数据的来源,数据的特征(划分)及算法的泛化能力。在此基础上指导入侵检测算法设计。通过分析正常进程的系统调用序列与异常系统调用序列的异同,可知进程的系统调用具有如下的特性:(1)局部规律性很强;(2)正常进程的系统调用与异常进程的系统调用序列具有不同的分布特性。特定的程序有特定的、相对稳定的结构,因此将确定性方法(短序列建库)与随机性方法(马尔科夫模型)相结合来建立模型。进程的系统调用具有的局部性与马尔科夫模型有天然的联系,因此在这一框架中用马尔科夫模型作为分类器。在PAC学习理论下分析检测模型的样本复杂度;通过对算法偏置与泛化能力的讨论,利用结构风险最小化原则指导学习机的设计。(2)利用时间序列分析技术提取特征,提出了基于线性预测的入侵检测方法。从提取特权进程的行为特征入手,引入时间序列分析技术——用线性预测技术对特权进程产生的系统调用序列提取特征向量来建立正常特征库,并在此基础上建立了马尔科夫模型。由马尔科夫模型产生的状态序列计算状态概率,并根据状态序列概率来评价进程行为的异常情况。然后,利用马尔科夫信源熵和条件熵进行参数选取,并对模型进行优化。(3)提出了基于矢量量化分析与马尔科夫模型相结合的入侵检测方法。针对传统监督学习的缺点,本文将聚类分析应用于有监督学习,提出了基于矢量量化分析与马尔科夫模型相结合的入侵检测方法。首先利用矢量量化方法对正常特权进程的短系统调用序列进行聚类分析,进而利用马尔科夫模型来学习聚类之间的时序关系。在矢量量化中利用动态分裂算法对短系统调用序列进行聚类分析,充分提取特权进程的局部行为特征的相互关系,因此可以在训练集很小的条件下使模型更精确、检测能力大大增强。(4)提出基于K-means与马尔科夫模型相结合的半监督异常检测方法。分析现有基于监督学习或非监督学习入侵检测方法优缺点的基础上,提出了一个新颖的基于K-means与马尔科夫模型相结合的半监督异常检测方法。半监督方法的学习样本包括已标示类别的样本和未标示样本,并且通过对已标示的样本的学习来指导对未标示样本的学习来提高识别率。本方法首先将经过标示的(正常的)系统调用序列投影到高维空间进行有监督聚类后,利用马尔科夫模型来学习聚类间的时序关系,建立起正常行为的初始模型。由马尔科夫模型产生的状态序列计算状态概率,根据状态序列概率来评价进程行为的异常情况。正常行为模型由两种关系确定:1)空间分布关系(聚类);2)空间的时序关系(马尔科夫模型)。在初始模型的导引下对未标示的序列进行学习,利用迭代过程对模型进行改进。实验表明该算法能够在已标示样本较少的情况下通过对未标示样本的学习来改善模型的检测性能,达到在线增量学习的目的。
其他文献
活血化瘀法是祖国医学中的一种重要疗法。妇女之生,以血为本,血是经、孕、产、乳的物质基础。血液旺盛,运行流畅,则能维护妇女正常的生理活动。若血行不畅,瘀结于内,则变生妇科诸病
为探索分离焮麻(Urtica cannabina L .)内生菌的最佳方法,并分离获得焮麻内生菌,探讨ERIC-PCR的引物在植物内生细菌分型应用中的优化及其与AP-PCR的结合在植物内生菌分子分型
目的了解蛛网膜下腔出血后脑血管痉挛的临床特点和影响因素。方法对70例外伤性蛛网膜下腔出血后脑血管痉挛的临床资料进行回顾性分析。结果蛛网膜下腔出血后脑血管痉挛主要发
调适中央与地方关系,关涉市场经济的持续健康发展,关乎国家的稳定大局,是贴近时代的重大理论研究命题。透视当代中国中央与地方关系,中央宏观调控屡遭地方挑战,中央与地方经
话语日益成为当代文化、社会与传媒研究中的一个重要概念。作为一种特殊的话语形式,大众媒体上的新闻扮演着潜移默化的影响大众、建构社会的作用。就像梵·迪克说的,对大多数
运用显性比较优势法、指数法、计量经济模型和特征比较法,本研究详细分析了我国畜牧业生产的区域特征、规模特征、动物疫病产业损失特征、动物疫病补贴制度的选择和标准。区域
近年来,基础隔震技术的应用越来越广泛,同时一些新的隔震体系如混合隔震和智能隔震系统也受到了研究人员的关注。本文的研究工作主要包括三个部分:1)隔震支座分析模型的归纳总结
水文时间序列一般含有周期性成分,但它不是严格的周期,只是概率意义上的周期。水文时间序列周期的识别、判定是一个较困难的问题,因此,对于如何有效地分析检测水文序列的周期,已成
近年来,增强道德教育的实效性问题是专家、学者和广大教育工作者非常关注的热点问题,未成年人道德教育的实效性问题尤为关注。初级体校学生的年龄大多是13━16岁,也属于未成
为了解决钢筋的锈蚀问题,国内外学者通过研究发现,采用纤维增强塑料筋(FRP)代替钢筋是最行之有效的。纤维增强塑料筋(FRP筋)是采用多股连续纤维作为增强纤维,热固性树脂作为基体