基于机器学习的匿名Tor网站指纹识别研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:liuwanfu2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
加密通信网络的目的是隐藏通信双方的关系和内容,一旦双方建立了加密通信网络,通信内容就会被加密,第三方的源和目标IP等路由信息也会被隐藏。当用户通过加密通信网络进行网页访问活动时产生的多次请求和应答的流量就是加密网页流量,使用网站指纹识别技术对这些加密网页流量进行识别,就可以在不破解用户加密数据的情况下得到用户访问的网页信息,对用户网络进行内容审查。在进行网站指纹识别时,其中最重要的一步就是确保进行识别的流量是单网页加密流量,因为现有网站指纹识别方法都是基于单网页流量进行网站指纹模型的构建,如果输入的待检测加密网页流量是多个网页的混杂流量,就不能对网站进行准确识别,影响网站指纹识别技术在实际审查场景中的应用。所以对每个加密网页流量的起始数据包即加密网页流量分割点进行识别,在此基础上得到单网页的加密网页流量进行网站指纹识别,就显得格外重要。针对上述挑战,本文提出了一种基于机器学习的匿名Tor网站指纹识别方法。本文提出的方案在具体实施时有网页流量分割点识别和网站指纹识别两个模型。网页流量分割点识别模型是根据相同时间粒度对数据包进行序列划分,使用时序特点对每个序列进行特征构造和提取,然后使用机器学习方法识别每组网页序列中的第一个序列作为网页流量的分割点标识。由于分割点和非分割点数量分布不平衡,本文提出分割点数据集不平衡解决方案,并对数据集进行数据不平衡处理实验。除此之外,本文还对不同时间粒度下的特征计算效率和识别准确率进行评估,经过与现有工作进行比较,结果显示本文提出的方法有更好的识别效率和效果。网站指纹识别模型是根据Tor浏览器在网页传输加载不同阶段数据包个数和长度的分布特征进行数据包截取,通过对截取数据包长度的累加和进行等距的特征提取,使用支持向量机算法对提取的特征进行分类,以此来识别不同的网站。由于不同数据包截取数量会对网站指纹识别的效率和准确率产生影响,因此本文对不同的数据包截取数量进行实验评估,选择最优的截取数量进行识别。经过与现有工作的比较,本文的方法在具有等效识别效果的基础上,计算效率更高。最后设计真实流量环境下的Tor网站指纹识别模型,并对实际采集的Tor流量进行网站指纹识别,验证了本文所提的方案在匿名Tor网站指纹识别审查时的有效性。
其他文献
许多数学物理问题都可归结为具有两个自变数的一阶拟线性双曲型方程组的定解问题.本文研究带有非齐次项且具常重特征的拟线性双曲组(?),其中源项F(u)满足相应地匹配条件.不加
相比于传统的窄带雷达,宽带雷达具有高距离分辨率,在许多方面都有着突出的优势,如:宽带雷达能够获取更多的目标特征信息,对目标运动参数的测量更加精确,对目标的识别能力更高,抗干扰性能更好等等。因此,宽带雷达可以应付当今新环境下各个领域给雷达带来的挑战和日益复杂的任务。研究宽带雷达信号处理的理论和应用,是当前军事课题研究的热点,且具有明朗的应用前景。为了在实际应用中更好的运用宽带雷达,其大宽带给高速目标
蓝莓的繁育和生长对自然条件有很高的要求。从自然地理的角度来看,延边地区在光照、土壤、温度和湿度等方面都十分适合蓝莓的生长。因此,我们有必要着重发展延边地区的蓝莓产业,依靠其自然优势来进行蓝莓的种植。延边地区的蓝莓产业在区域经济发展中占有重要地位。近年来,延边蓝莓产业的各个环节都出现了与市场发展不相适应的问题,这也使得目前蓝莓自身产业发展难以融入当地产业经济。延边地区和丹东地区同为我国北方特色蓝莓产
化石燃料燃烧造成的能源短缺和环境污染问题日趋严重,人们对清洁高效的能源转化装置的需求日趋强烈。燃料电池因其绿色环保、转化效率高等优点在能源转化方面受到了广泛的关注。贵金属铂、钯是良好的燃料电池催化剂,但价格高昂、催化活性和稳定性欠佳,这阻碍了燃料电池商业化的发展。研究者通过掺杂其它金属原子,或者合成具有特殊结构、形貌和组分的电催化剂来实现贵金属原子利用率最大化,降低催化剂的生产成本,提高催化剂的催
近年来,为了适应国家节能减排的需要,各大钢厂高炉系统都在不断地采用高效节能的新型风机,逐渐淘汰低效率而且耗能高的旧型风机。高炉鼓风机组是高炉最重要的动力设备,它不但
钴基硫属化合物凭借其种类繁多,成本低廉以及优异的变价特性,成为新一代钠离子电池负极材料的候选者之一。然而,钴基硫属化合物在脱/嵌钠过程中会产生较大的体积变化,使得电极材料结构破坏严重,容量衰减迅速,极大限制了其进一步地应用。为解决上述问题,研究者们通常会采用结构设计,复合改性以及掺杂改性三种研究策略。然而,目前已报道的研究工作中,大部分钴基硫化物材料的制备过程中均存在一定的问题,一方面这些通用的合
《普通高中地理课程标准(2017版)》中对学生的地理思维能力做了明确的规定,地理综合思维是地理学的基本思维方式。随着各种培养方式的涌现,信息技术的使用成为这其中最有效、便捷的方式之一。CorelDRAW作为一款功能强大的制图软件受到广大地理工作者的喜爱,将CorelDRAW地理制图与地理综合思维的培养相结合可以丰富地理综合思维的培养方式,提高信息技术在实际教学过程中的使用率,更好地达成培养目标。本
随着中国经济的较快发展和工业化、城镇化进程的加快,能源需求不断增长,化石燃料的消耗殆尽必然带来世界的能源危机问题,本世纪以来太阳能与其他新型能源已成为了重要的替代
土地是经济社会发展不可或缺的要素资源,也是不可再生的稀缺性资源,十分珍惜和合理利用土地资源、推进资源循环高效利用已经成为各级政府加强和改进国土资源管理的共识,并且已经成为推进高质量发展的战略选择之一。但在土地粗放利用的惯性下,各地仍有大量的闲置和低效用地存在,这既不利于未来的可持续发展,又造成了资源的浪费。尽管近年来,国家出台了一系列政策措施清理盘活闲置和低效用地,全国各地也相继进行了一系列卓有成
随着企业应用开发规模的不断扩大,传统的单体架构越发庞大、复杂,已无法满足市场需求。微服务架构凭借其有效的可扩展性、轻量级、敏捷部署、资源隔离等优势,逐步成为主流部署模型。但微服务架构也存在一个不可忽视的问题——级联故障。一个云平台中部署着数量庞大的微服务,这些微服务相互关联,形成一个复杂的关系网,一旦其中一个或两个微服务发生故障,就可能牵连其他微服务,造成大规模故障,导致全局性能下降甚至系统崩溃。