HTTPS网页流量的指纹提取和识别技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:huan3036646
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络通讯技术的发展,为了有效能够保障用户个人隐私问题和数据传输安全,加密流量被广泛应用到了网络传输中。对于网页通讯,越来越多的Web站点也选择使用HTTPS协议来进行网页数据的传输。然而,许多不法分子利用了HTTPS协议的特性,在HTTPS网页中传播有害信息。为了能够有效地对HTTPS流量进行管理,需要采用一种方法对目标HTTPS网页建立指纹库,完成对未知HTTPS流量的指纹识别。本文在确立了两种可以作为HTTPS网页指纹信息的特征值后,首先实现了一套网页指纹信息采集系统,可以对目标网页进行实时的指纹库构建。系统通过主动访问目标HTTPS网页,同时采用旁路监听的方式进行网页流量捕获,从而采集网页的指纹信息。然后,研究了基于C4.5决策树算法的网页指纹识别方法对于HTTPS网页的识别效果,分别在只包含目标网页和包含背景流量的数据集上进行实验,并对实验结果进行了分析。在取得了上述实验结果基础上,本文又提出了一种基于网页对象特征的网页指纹识别算法,并实现了该算法的基础模型。鉴于实际网络环境中存在大量网页混合流量,本文分别研究了该算法对单个目标网页、多个目标网页以及加入背景流量后的网页指纹识别效果。最后,对上述两种指纹识别方法进行了对比和分析,阐述了其各自存在的优缺点以及方法本身适应的网路环境。结果表明,基于网页对象特征的网页指纹识别算法在识别含有多个目标网页的混合流上具有较高的可行度,且背景流的加入并不会影响到算法的正常运作。
其他文献
汉语里表示什么地方出现、存在或消失什么东西常常用存现句的结构形式来表示,存现句中的动词后面常常用"着、了、过"等标记来表示存在、出现或消失等意义。但这些标记不是存
生态涵养区是北京重要的生态屏障和水源保护地,是城市的“大氧吧”和“后花园”,在《北京城市总体规划(2016年—2035年)》(以下简称“新总规”)确定的城市空间布局中处于压轴
最近几年,高端水市场备受关注,国内高端水品牌集体崛起,如西藏5100、昆仑山、格莱雪、天格尔、珠峰冰川、巴马丽琅、帕米尔、阿尔山的出现,打破了法国依云等国际品牌独占中国高端
报纸
膀胱癌(BC)是泌尿系统最常见的恶性肿瘤之一。近年来其发病率在我国有逐渐增高趋势。对其肿瘤标志物的检测有利于早期诊断,从而降低膀胱癌的复发率。作者就目前对膀胱肿瘤标
本文采用问卷调查法和文献资料法,对自行车运动员损伤产生原因、各项目运动损伤的种类,以及运动损伤的部位等进行分析,提出减少运动损伤的建议和方法。
建筑场地的地形环境与气候条件构成了独特的设计语境,建筑的绿色设计应注重场地环境、气候条件的分析,基于场地、气候适应性进行方案创作,形成场地与气候响应设计。以永州市
目的:探讨广西医院医疗费用过快增长的原因及其对策。方法:通过广西卫生统计年鉴,对2010-2011年广西各级住院病人年均医疗费用增长情况进行统计分析。结果:统计发现,医院费用
论述了大型LNG储罐的建造标准、罐体材料、罐体设计、焊接、绝热、施工。指出9Ni钢强度、韧性需改进,可尝试细化晶粒、提高纯净度、添加合金元素等方法。9Ni钢焊接不当易造成
目的:探讨亚胺培南西司他丁钠治疗重症肺炎临床效果及对PCT、CRP、IL‐6等指标的影响。方法:纳入2016年1月~2018年12月在我院就诊的重症肺炎患者62例,根据随机数表法分为对照
采用溶剂热制备了氨基功能化纳米Fe3O4磁性复合材料(NH2-nFe3O4),并进一步通过缩合、配位等反应得到Fe(Ⅲ)-Salen功能化纳米Fe3O4复合材料(nFe3O4@Fe(Ⅲ)Salen).通过元素分析(EA)、X-射