基于数据挖掘的未知协议识别技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:mnbvcxzxzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今的通信网络技术环境下,无论是通信网络中的安全维护,还是电子对抗中的信号侦察,网络目标识别均具有迫切的现实需求。尤其是针对军事或某些专用网络中使用的非公开网络协议,分析并识别专用网络中的未知协议具有十分重要的研究意义。数据链路层上截获的数据通常以比特流的形式存在,从不具有任何语义的比特流数据中提取出未知协议的特征较为困难。本文研究数据链路层上的未知协议帧结构识别。当前国内外在面向比特流的未知协议识别方面的研究进展缓慢。在现有面向比特流的未知协议识别技术中,通常采用模式匹配和数据挖掘技术进行未知协议的识别。本文尝试基于数据挖掘的思想,从截获的大量未知协议比特流数据中挖掘出具有特殊意义的比特序列,从而进一步推测未知协议的特征与帧结构。首先,本文详细调研了传统面向比特流的未知协议识别方案,主要包括AC(Aho-Corasick)快速统计、频繁序列筛选、长序列拼接和序列关联规则分析等处理流程。通过仿真实验发现,传统方案中存在AC快速统计的存储结构复杂、长序列拼接算法复杂度过高等缺陷。其次,针对传统未知协议识别方案中的上述缺陷,提出了改进的未知协议特征序列挖掘算法。优化了AC快速统计的存储结构,并分析了其与N-gram算法之间的关联性。针对传统长序列拼接复杂度较高的问题,提出了基于位置差的低复杂度长序列拼接算法和基于连续位置的长序列拼接算法。实验结果表明,提出的两种新长序列拼接算法均能够大幅降低拼接的时间复杂度。另外,由于拼接后得到的频繁长序列集合中存在大量具有包含关系的序列,本文提出了一种子序列归并算法。实验结果表明,子序列归并算法对候选特征序列的精简效率达到了81%。最后,利用挖掘到的未知协议候选特征序列集合,本文尝试对未知协议的帧特征进行分析。分别提出了针对定长帧协议的帧长计算算法和针对非定长帧协议的帧切分算法,以及定长帧协议和非定长帧协议的帧结构推测方案。实验结果表明,提出的新方案能够有效确定未知协议的特征和帧结构。
其他文献
【目的】探讨银杏内酯B对阿霉素损伤心肌细胞的干预作用及相关机制。【方法】复制体外H9C2大鼠心肌细胞阿霉素损伤模型,以钙网蛋白沉默RNA(CRTsiRNA)干扰沉默钙网蛋白(CRT)的
针对接触式IC卡技术的接触问题以及有源工作,采取射频识别技术与IC卡技术相结合的方法,解决了IC卡技术接触性的问题,实现IC卡的非接触使用与无源工作的功能,并在此基础上附加
近年来,基于位置服务(Location Based Service,LBS)的兴起加快了移动智能领域的发展,越来越多的移动开发者投身于LBS应用开发。与此同时,对位置信息获取的精确性、稳定性、节
论文针对运动轨迹重建系统的发展现状和应用前景,结合相关GPS定位、GIS地图等技术手段,应用现今主流技术在Android系统平台上设计并实现了运动轨迹重建系统,主要研究内容为以
本研究以模式植物拟南芥(Arabidopsis thaliana)为材料,就超低温处理和重金属镉处理两方面的胁迫对其DNA甲基化变化分别进行研究分析。采用甲基敏感扩增多态性(MSAP)技术分析其基
2012年,国家财政性教育支出占GDP的比重首次突破4%,达到4.28%,被看作我国教育事业发展的一个新起点,高等教育作为人才培养和科学研究的高地,其财政性支出占教育总支出的比例
详细论述了高校图书馆的网站建设,探讨了网站维护应注意的问题,对图书馆网站的发展方向提出了建议。
围绕区高品质课堂和教师专业成长主题年活动,创建市特色高中、省教育教学改革典型学校(智慧校园),全面深化教育科研、校本研修、信息化建设改革,三落实五引领六创新,全力打造自主发
大量研究表明,大学生的信心和英语驾驭能力游刃有余时,其完成的大学英语创意写作质量就越高,自我效能感自然越强。在大学阶段提倡创意写作,是因为写作技能是语言能力的重要方
随着通信行业从2G、3G到4G,再到未来的5G的发展,通信天线也随之不断地更新换代。高速高质量的通信需要高性能的天线来支持,高指标的三阶互调天线不仅是未来通信质量和速度的