未明协议格式特征提取与报文分类

来源 :战略支援部队信息工程大学 | 被引量 : 1次 | 上传用户:a30355115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,出于各种安全、经济利益、隐私等因素的考虑,大量网络应用采用未明协议(也被称为私有协议、未知协议)。这些协议没有公开的协议规范用来识别协议报文,它的存在造成了较大安全隐患,不利于网络安全监管。例如大量恶意软件在进行通信进而控制计算机时所采用的是未明协议,由于没有公开协议规范,不能对恶意流量进行有效拦截,以至于造成网络的大面积瘫痪及失泄密现象。在类似安全事件中,未明流量的准确识别分类是处理恶意流量拦截等网络安全监管和控制问题的重要手段,而获取未明流量特征是准确识别未明协议报文的关键。因此,挖掘未明流量特征,进而分类识别未明流量,是网络监管中一项重要任务。在实际网络中,采集到的数据是多种类型混合的报文数据集,由于受到接收条件的限制,接收到的数据常常是无序、离散的,不具有构成会话的报文间约束关系。另外,需要处理分析的报文数据规模常常是巨大的。针对实际网络数据的特性和对其准确快速识别的要求,本文通过提取报文载荷格式特征,来实现以报文为颗粒度的混合未明报文分类。论文的主要研究内容如下:1.针对聚类特征矢量构造及相关聚类问题,提出了基于熵估计的未明流量自动分离算法(An Unknown Traffic Separation Method Based on Entropy Estimation,EMEE)。该算法利用字节熵矢量变化程度,度量各偏移位置上固定关键词字节存在的可能性,初步估计固定位置关键词所覆盖区域,克服了依据人工经验设定载荷截取长度的弊端,采用两级聚类的方式对有效载荷进行聚类,提高了聚类效果并使得聚类簇数更加接近于真实种类数目。采用DARPA数据集和校园网采集的网络数据进行验证,实验结果表明EMEE算法能有效降低数据字段对未明流量分离的干扰并使得聚类得到的簇数接近于真实种类数目,对18种类型组成的混合报文集分离,各类报文的漏报率和误报率均低于2%,优于传统算法。2.针对报文关键词序列提取的问题,提出了基于字节链路的关键词序列提取迭代算法(An Iterative Algorithm for Keyword Sequence Extraction Based on Byte Link,BLIS)。该算法通过以链路作为基本单元完成报文建模,有效地降低关键词和数据字段的混淆程度;面向固定位置关键词挖掘,通过链路熵矢量估计有效挖掘空间,然后在该空间内得到带位置信息的频繁链路集,以较强约束从频繁链路所构造的字段中选出固定位置关键词;面向可变位置关键词,通过获取频繁链路方法搜索备选关键词位置,对齐可变位置关键词,迭代地完成后续可变位置关键词的挖掘。利用DARPA数据集和校园网采集的网络数据进行评估,实验结果表明,和传统方法提取到的特征相比,该方法提取到的特征形式和性能更具优势。3.设计了基于Hadoop平台的未明流量关键词提取系统,设计并实现了并行的频繁模式挖掘(改进的Apriori和FP-Growth)算法。具体工作包括:1)改进的Apriori和FP-Growth并行化算法设计;2)并行Apriori算法根据软件设计图进行了代码实现,而并行FP-Growth借助Mahout进行了实现;3)性能测试。在Hadoop分布式平台上的测试结果表明,相比较于串性算法,并行化处理随数据规模的增长更为缓慢,处理海量报文时,并行算法的运算效率较高。
其他文献
校园文化是学校师生在长期教育实践活动中共同创造而形成具有学校特色的物质文明和精神财富的总和,包括物质文化、行为文化、制度文化和精神文化四个层面。校园文化是学校发
复杂空间钢结构建筑的飞速发展为结构防火分析和设计带来了新的挑战。在分析现有规范和性能化设计方法中结构防火设计不足的基础上,基于火灾科学、结构工程、计算机模拟等多个
目的:本次研究采用分子流行病学方法在职业性铝接触人群中开展研究,评估长期职业性铝接触人群认知功能改变情况,分析血铝与外周血淋巴细胞H3K4me3、H3K9me2、H3K27me3及血浆B
松嫩平原地处黑龙江省和吉林两省境内,是我国重要的商品粮生产基地,2017年两省的粮食作物种植面积为1415.43万hm2和554.40万hm2,产量分别为7410.34万t和4151.00万t。气候条件作为作物生产的重要因素,与作物生长发育和产量形成密切相关。气候条件温度和降水变化影响作物生长发育进程,农业生产中可通过耕作措施改变土壤的物理性质,包括土壤温度、水分和微生物活性,从而改变作物的生长条
本文借助于区域分解思想并基于自然边界归化理论,研究椭圆外区域各向异性Helmholtz可题的D-N交替算法.首先,通过坐标变换将各向异性方程进行转化,应用自然边界归化原理获得该
脆江蓠(Gracilaria chouae)藻体脆性大,短时间高盐海水浸泡可使其软化,有利于规模夹苗生产。采用实验生态学方法研究短期高盐胁迫对脆江蓠光合生理及生化组成的影响,以探讨高
本文以某主墩承台地处岸边岩溶区的独塔双索面斜拉桥为研究对象,介绍了大面积锁扣钢管桩围堰在河边岩溶区的应用情况,并采用midas Civil软件对围堰各个不利工况受力进行验算
根据中美科技交流工作第四次会议纪要确定,中国果品蔬菜贮藏保鲜技术考察组一行四人,应美国政府邀请,于1983年9月12日至10月11日对美国果品蔬菜贮藏保鲜技术进行访问考察。
目的:在CYP2A6*4突变频率高的中国人中测定CYP2A6*4等位基因对右美托咪定药代动力学的影响,为临床提供参考。方法:31名手术患者通过静脉泵接受0.5μg/kg右美托咪定后,抽取多
通过研读、学习科学学科核心素养,从对科学教育的反思出发,以高中物理、化学、生物学科为例,阐述科学学科核心素养的几个维度,实现对科学学科核心素养的正确认识,探索培养科