混合数据聚类的网络入侵检测算法研究

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:lvbocai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:在聚类分析中,距离及差异性(或相似性)度量方法是最基础的概念,度量方法的选择直接影响聚类结果的质量。本文在已有聚类算法的基础上,将混合数据的相异度矩阵与K-means算法相结合,提出了一种切实有效,具有较强通用性、稳定性的方法,对于入侵检测具有重大的现实意义。
  关键词:聚类算法;入侵检测;相异度;遗传算法
  中图分类号:TP393.08
  1 混合数据的相异度的基本原理
  1.1 KDDcup99数据集。该数据集首先在与KDD99同时举办的第三届国际知识发现和数据挖掘工具竞赛上使用,它包含了在军事网络环境中仿真的各种入侵数据。大多数的算法试验采用这一数据集,但往往都只对原始数据集进行简单的处理,以满足实验算法的需要,并没有考虑到原始数据集的特点,甚至破坏了原始数据集的特性。因此得出的实验结果并不能真正的反映问题,而且现实应用具有一定的局限性。
  1.2 特征提取与主成分分析。对于实验所用的KDD99数据集,维数较高,数据量很大,聚类时需要耗费大量的时间,使得聚类变的难以实现。因此我们需要对其进行特征提取,使原有庞大的数据集改变的简单短小,并且可以保留原有数据的完整性,在这样抽样的数据上进行数据处理,效率变的更高。
  1.3 K-Means算法原理。原始k-means算法的处理的过程为:要随机地选择若干k个对象,其中每个对象原始地代表了一个簇的平均值或中心。对其他剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近簇。然后重新进行计算每个簇的平均值。此过程不断重复,一直到准则函数收敛。
  2 基于相异度矩阵的K-means算法
  参考文献:
  [3]Eskin E,Arnold A,Prerau M et al.A geometric framework for unsupervised anomaly detection: Detecting intrusions in unlabeled data.In Data Mining for Security Applications,2002.
  [4]Jiawei Han,Micheline Kamber.數据挖掘概念与技术(原书第二版)[M].范明,孟小峰.北京:机械工业出版社,2007,3.
  作者简介:翟玲(1975.9-),女,1997年毕业于西安科技大学计算机及应用专业本科,项目管理专业研究生,助理工程师,从事数字图书馆、手机图书馆研究,现工作单位:西安科技大学图书馆。
其他文献
【正】 中国、希腊等“古代各族是在幻想中、神话中经历了自己的史前时期”。远在创造和使用语言的初期,物我不分,万物有灵的“神话思维”就是人类全部精神活动的方式,它的余
研究了单片机控制在地球化学录井测试系统中的应用,对地球化学录井技术进行了深入的分析,用地球化学方法测定并计算油层孔隙度、剩余油储量、驱油效率和水洗程度等地球化学参数.对单片机控制系统的硬件结构和软件结构作了较详细描述.系统具有结构先进合理和功能完善等特点,其接口单元解决了传统接口单元采集板零点和标度尺校正精度低和过程麻烦等缺点.
以菜豆种子为对象,建立了物料的内部水分扩散模型.通过边界条件的处理把反映物料干燥过程动态特性的实验含水率曲线与物料颗粒内部水分扩散相结合,提出了一种较准确的确定物料
~~
期刊
【正】 李白《赠孟浩然》诗云:“吾爱孟夫子,风流天下闻。红颜弃轩冕,白首卧松云。醉月频中圣,迷花不事君。高山安可仰,徒此揖清芬。”诗中扬溢着对孟浩然崇拜敬仰的感情。性
随着现代社会信息技术以及计算机技术的飞速发展,计算机信息管理系统在人们的学习、生活和工作中都被广泛应用。计算机信息管理系统已经得到了普及,但是同时引发的计算机信息
【正】 现代知识的增长,不仅表现为知识的高度综合与高度分化的趋势,而且呈现出一种社会化的趋势。这集中表现为,知识的作用已经日益渗透到社会生产及社会生活的各个领域之中
寻常疣俗称"刺瘊""瘊子",中医称为"千日疮""枯筋箭",是由人类乳头瘤病毒感染引起的一种常见皮肤病。本病好发于颜面、颈部及手足处,皮损特点为针头至黄豆或更大的半球状突起,表面粗糙
利用低码率视频压缩标准(例如H.261、H.263)编码的视频数据在互联网上传输时,丢包将导致图像质量急剧恶化.文中建议了一种新的错误掩盖方法以弥补丢包对图像质量的影响.该方
研究了强噪声混合条件下的独立分量分析(ICA)问题.提出了一种将级联双稳随机共振(SR)用于有噪ICA盲源分离的方法.该方法利用级联双稳SR对时域波形降噪的优良特性,先对有噪ICA信号进