论文部分内容阅读
暗网构建在公共网络之上,需要特殊的软件、配置或者认证才能访问,相对传统的互联网网络,暗网具有匿名性强、溯源难、动态性高等特点。暗网建立的初期目的是保护互联网用户的通信隐私,但现在的暗网中存在着大量违反法律的信息,不法分子在暗网中从事非法活动,暗网已经严重威胁了网络空间安全。暗网之所以对网络空间安全构成一大威胁,很大原因是因为它难以实现追踪溯源,能够实现对暗网的追踪溯源,将可以对暗网中的非法行为起到威慑作用,有效的减少暗网中的违法犯罪行为,维护网络空间安全。本文在现有基础上进一步对暗网追踪溯源技术展开研究,重点通过暗网客户端和暗网服务器端两个维度进行追踪溯源研究。
在暗网服务器端追踪溯源技术研究中,通过对暗网数据进行收集与分析来实现追踪溯源。进行暗网追踪溯源研究,需要对暗网网址进行收集,面对暗网网址不公开,难以收集的难题,本文采用基于Tor2web和基于暗网爬虫的方法来收集暗网地址,并对暗网网站内容进行了收集。针对暗网信息繁多而且冗余的问题,对爬取的数据进行分析处理,并对关键信息进行提取,提取的关键信息将用于暗网网站识别和暗网用户行为画像的研究,其次是对暗网网站中敏感信息进行提取,这些敏感信息可以暴露暗网用户身份,通过这些信息可以追溯到暗网用户的真实身份,在研究过程中,用实际案例展示了分析得到的信息在暗网服务器端追踪溯源中的关键作用。
在暗网客户端追踪溯源技术研究中,通过暗网流量实现追踪溯源。访问暗网使用了特殊的软件和配置,暗网流量经过多层加密,使得传统的流量识别方法不再适用于暗网流量识别,针对这一问题,对利用暗网流量实现用户追踪溯源的过程进行分析,追踪溯源过程主要包括流量收集、特征提取、模型训练和用户追溯,目前使用Tor网络的人数最多,本文对Tor网络进行重点研究,通过对暗网流量特征分析,设计了暗网流量识别算法用于在加密的流量数据集中识别暗网流量,对识别出来的暗网流量进一步分析,设计了暗网流量行为识别算法用于暗网客户端追踪溯源,通过对暗网流量识别分析,实现暗网客户端追踪溯源。
在暗网服务器端追踪溯源技术研究中,通过对暗网数据进行收集与分析来实现追踪溯源。进行暗网追踪溯源研究,需要对暗网网址进行收集,面对暗网网址不公开,难以收集的难题,本文采用基于Tor2web和基于暗网爬虫的方法来收集暗网地址,并对暗网网站内容进行了收集。针对暗网信息繁多而且冗余的问题,对爬取的数据进行分析处理,并对关键信息进行提取,提取的关键信息将用于暗网网站识别和暗网用户行为画像的研究,其次是对暗网网站中敏感信息进行提取,这些敏感信息可以暴露暗网用户身份,通过这些信息可以追溯到暗网用户的真实身份,在研究过程中,用实际案例展示了分析得到的信息在暗网服务器端追踪溯源中的关键作用。
在暗网客户端追踪溯源技术研究中,通过暗网流量实现追踪溯源。访问暗网使用了特殊的软件和配置,暗网流量经过多层加密,使得传统的流量识别方法不再适用于暗网流量识别,针对这一问题,对利用暗网流量实现用户追踪溯源的过程进行分析,追踪溯源过程主要包括流量收集、特征提取、模型训练和用户追溯,目前使用Tor网络的人数最多,本文对Tor网络进行重点研究,通过对暗网流量特征分析,设计了暗网流量识别算法用于在加密的流量数据集中识别暗网流量,对识别出来的暗网流量进一步分析,设计了暗网流量行为识别算法用于暗网客户端追踪溯源,通过对暗网流量识别分析,实现暗网客户端追踪溯源。