二进制私有协议逆向关键技术研究与实现

来源 :战略支援部队信息工程大学 | 被引量 : 5次 | 上传用户：xds24

【摘要】

：

私有协议是因商业保护等原因未公开技术规范的一类协议。协议逆向是在协议规范未知的条件下,通过对协议实体的报文序列或指令序列进行监控和分析,获取协议规范的过程。私有协

【作者】

：

闫小勇

【出处】

：

战略支援部队信息工程大学

【发表日期】

：

2018年01期

【关键词】

：

协议逆向二进制私有协议协议报文聚类格式关键词边界确定协议状态机推断

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

私有协议是因商业保护等原因未公开技术规范的一类协议。协议逆向是在协议规范未知的条件下,通过对协议实体的报文序列或指令序列进行监控和分析,获取协议规范的过程。私有协议逆向在无线网络对抗、恶意软件分析、漏洞挖掘和网络管理等方面发挥着重要的作用,受到越来越多的关注。以工业控制、自动驾驶为代表的大规模物联网业务已成为未来网络的三大主流业务种类之一,鉴于机器到机器通信的特殊需求,此类业务广泛采用面向比特自定义的通信协议。因此,随着物联网迅猛发展,二进制私有协议逆向已经成为未来协议安全领域迫切需要解决的问题之一。面向比特定义的二进制协议往往以离散报文序列的形式出现,无法通过协议交互过程提取流属性特征;同时对协议的识别只能以报文为颗粒度,相比于以流为颗粒度的协议识别,难度更大。为提高网络传输效率,二进制协议通常使用自定义字符集,以比特为单位定义字段,相比于面向字符定义的协议,在无定界符等先验信息的条件下字段边界的确定尤其困难。此外,二进制协议报文状态类型不等价于格式类型,状态类型取决于状态相关字段,因而协议状态机推断需要基于状态相关字段。由此可见,二进制私有协议的逆向面临众多特有问题,目前已成为协议逆向领域的研究难点之一。本文重点研究二进制私有协议逆向问题,分别从协议识别,格式规范提取和行为规范提取三个方面展开,主要工作和创新点如下:1.针对二进制协议面向比特定义,报文维度过高,传统聚类算法聚类簇数和聚类中心难以确定的问题,提出一种基于改进主成分分析和密度峰值的二进制私有协议报文聚类算法。提出基于信息增量确定降维维度的主成分分析算法,在去除冗余的同时保留了原始数据特征;提出基于距离指数加权的密度峰值聚类算法自动选取聚类中心,有效提高了聚类中心和其它报文的区分度。通过在AIS、ARP、DNS、ICMP和SMB协议报文构成的三个数据集上测试,本算法对二进制协议报文具有较好的聚类效果,纯度和F值均在80%以上,与K-means、DBSCAN等经典聚类算法相比,F值平均提升约10个百分点。2.针对二进制协议字段定义灵活,字段偏移量难以准确确定的问题,提出一种基于最佳路径搜索的二进制私有协议格式关键词边界确定算法。提出基于迭代n-gram-position的格式关键词边界提取算法,有效解决了n-gram算法中n值不易确定和固定偏移位置格式关键词边界提取的问题;定义了频繁项边界命中率和左右分支信息熵为基础的分支度量,以关键词和非关键词的n-gram-position取值变化率存在差异为基础构造约束条件,提出基于最佳路径搜索的格式关键词边界选择算法,实现了对格式关键词的联合最优定界。通过在AIS1、AIS18、ICMP00、ICMP03和Net Bios五种不同类型协议报文数据集上测试,本算法的F值均在83%以上,与VDV(Variance of the Distribution of Variances)和Auto Re Engine经典算法相比,F值平均提升约8个百分点。3.针对二进制协议报文状态类型不等价于格式类型,通过聚类很难区分不同状态类型报文的问题,提出一种基于状态相关字段的二进制私有协议状态机推断算法。提出基于最长公共子序列距离的状态相关字段识别算法,有效刻画了协议会话的行为逻辑相似性;提出基于邻接表的初始状态机构建算法,克服了传统基于APTA(Augmented Prefix Tree Acceptor)树构造初始状态机,规模庞大,操作过多的问题;提出基于概率统计的异常会话去除和基于出度、入度的相似状态合并算法,有效降低了协议状态机的规模。通过在TCP和SMB协议数据集上测试,本算法能够有效推断二进制私有协议状态机,准确率和召回率均在90%以上。4.私有协议数据智能分析系统设计与实现。分析了系统应用需求,设计了软件架构,支持数据库数据导入导出、性能指标统计、结果的图形化展示以及菜单式用户操作等功能。初步实现了核心算法,包括协议关键词特征提取、协议报文聚类、协议字段格式提取、协议状态机推断,并对系统不同模块分别进行了功能和性能测试。

其他文献

闲话大风堂

<正>古往今来,文人墨客、书画印人、古玩藏家,都喜欢为自己的书房画室或客厅取一个堂号,以示风雅。张大千也不例外,堂号大风堂。不过,张大千的堂号是与他的二哥张善孖合用的(

期刊

大风堂同门录第三代胡若思张大千孙家勤

潮流能水轮机叶片结构有限元分析及选型研究

潮流能作为一种新型可再生能源,因其具有诸多优点受到了世界众多国家的青睐。叶片是潮流能发电装置的重要组成部分,其性能的好坏直接影响着水轮机的工作效率。其中,良好的水

学位

潮流能水轮机叶片复合材料有限元分析选型研究

水性免中涂工艺参数对金属漆中铝粉定向的影响

探讨了在水性免中涂（IPP）喷涂工艺的条件下，不同的色漆和清漆层施工参数对铝粉定向排列的影响。通过研究不同条件下的色漆层湿膜固体含量，抗清漆回溶能力和流变特性，初步总结了在

期刊

铝粉定向闪干时间预烘烤水性金属漆施工黏度

基于供应链管理模式的现代物流园区总体规划

在全球经济一体化的背景下,物流产业在世界范围内引起了广泛关注。物流园区是物流业发展到一定阶段而产生的一种新兴物流集输方式,是提供物流服务、组织物流活动、完成物流功

会议

物流园区供应链总体规划乌鲁木齐

论小说《鼠疫》中的英雄观及其现实意义

作为集中讨论荒诞的第一人,加缪在涉及死亡与拯救主题的小说《鼠疫》中,为人们展示了荒诞境遇下的集体反抗行为,并暗示了一种超越荒诞的最佳英雄主义。这种英雄观诞生于荒诞,

期刊

《鼠疫》荒诞英雄主义现实意义行动

葡萄糖氧化酶在畜牧生产中的应用

<正>葡萄糖氧化酶(Glucose Oxides,GOD)是由黑曲霉等发酵制得的一种需氧脱氢酶,在有氧条件下,能专一地氧化β-D-葡萄糖成为葡萄糖酸和过氧化氢。高纯度葡萄糖氧化酶为淡黄色

期刊

氧化酶植物血凝素畜牧生产仔猪成活率青贮饲料基础日粮断奶仔猪抗营养因子鸡蛋品质饲料转化效率

压铸用固体涂料喷枪

压铸用固体涂料喷枪是电加热气动喷涂装置,其原理:经过预热的压缩空气将加热成液态的固体涂料,有控制的雾化后喷涂铸型型腔。涂料输出量无级调节,具有常规气动喷枪工艺性能。

期刊

固体涂料喷枪压力铸造雾化器

胆碱在水产动物中的营养研究

本文就水产动物胆碱的生理功能、需要量及其与甲基供体间的关系进行综述,旨在为水产动物胆碱的营养研究,鱼类全价高效配合饲料的开发提供参考。

期刊

水产动物胆碱需要量脂肪代谢

薄芝糖肽注射液、注射用血塞通联合水蛭免煎颗粒治疗椎-基底动脉供血不足性眩晕的临床观察

目的观察薄芝糖肽注射液、注射用血塞通联合水蛭颗粒治疗椎-基底动脉供血不足性眩晕的临床疗效。方法将86例椎-基底动脉供血不足性眩晕患者随机分为2组。对照组43例予盐酸氟

期刊

椎底动脉供血不足眩晕中药疗法中成药

文革中被破坏珍贵文物不完全清单

<正>1.炎帝陵主殿被焚,陵墓被挖,焚骨扬灰。2.造字者仓颉的墓园被毁,改造成了"烈士陵园"。3.山西舜帝陵被毁,墓冢挂上了大喇叭。4.浙江绍兴会稽山的大禹庙被拆毁,高大的大禹

期刊

红卫兵文化大革命大成殿文成公主保皇派中央文史馆霍去病珍贵文物

二进制私有协议逆向关键技术研究与实现

与本文相关的学术论文