论文部分内容阅读
网络实体IP定位(简称IP定位)是指通过多种技术手段估计配置有IP的网络实体(如路由器、终端主机等)的地理位置。开展IP定位及相关技术的研究,可为基于位置的服务推广、敏感网络目标定位、网络诈骗与恶意攻击行为研判取证、网络态势感知等提供技术支撑,具有重要的理论意义与应用价值。目前,随着研究的深入,在现有的定位方法中,基于网络测量的IP定位成为主流方法,对于该类方法,区域性网络拓扑构建以及基于特殊结构的区域拓扑分析十分重要。然而,传统的网络拓扑相关研究很少聚焦于IP定位,所获取的拓扑区域性不强;对区域性拓扑中包含的具有城市归属性的不同特殊结构尚缺乏深入的分析研究。为此,本文基于实际互联网环境下的时延、路径等网络特性的分析,并围绕如何将这些特性应用于区域网络拓扑构建、基于特殊结构的区域拓扑分析以及目标IP定位开展研究,主要工作包括:1、阐述了开展IP定位技术研究的理论价值和现实意义;介绍了当今主流的基于网络测量的IP定位方法;详细的介绍了传统网络拓扑分析的研究进展;分析并指出了在区域网络拓扑构建、基于特殊结构的拓扑分析等方面亟待解决的若干问题。2、针对区域网络拓扑边界判定中的边界路由识别问题,提出了一种面向IP定位的城市网络拓扑边界路由IP识别算法。首先,在目标城市内外部署探测源,对城市内部地标探测,获取时延、路径等信息,从公开数据源获取路由IP主机名信息;然后,计算路由IP间的单跳时延,将城市内部单跳时延最大值作为阈值,同时计算路由IP主机名间的相似度;其次,对于从城市外部探测源获取的路径,从后向前依次将单跳时延与阈值比对,将单跳时延由小于阈值变为大于阈值的IP作为边界IP;最后,对于时延变化不明显的路径,从后向前依次比较前后跳IP主机名字符串的相似度,依据相似度的变化识别路径中的边界IP。在中国、美国的多个城市进行了边界IP识别实验,结果表明:相比于传统的基于时延分布的边界IP识别、基于探测路径统计分析的边界IP识别方法,所提算法能够处理的路径比例更高,分别平均提升约106.9%、73.4%,识别边界IP更为准确,获取IP级节点的准确率分别平均提升约51.8%、17.3%。3、别名解析对于准确的获取节点及连接、构建区域网络拓扑,从而支撑特殊结构分析及IP定位非常重要,提出一种面向IP定位的大规模网络的别名解析算法。首先,从公开数据源获取特定目标区域一定数量的已知别名IP与非别名IP样本,部署探测源对样本IP及区域内待解析IP探测,获取时延、路径等信息;然后,为样本IP构造包含时延相似度、路径相似度等四维特征的向量,将样本的特征向量输入分类器,训练分类模型;其次,设计过滤规则,排除待解析IP中部分不可能存在别名关系的IP;最后,对于过滤后剩余的待解析IP,构造其特征向量并输入已训练好的分类模型,得到分类结果。基于来自CAIDA的分布于中国、美国一些地区的百万级样本数据进行了实验测试,结果表明:与现有的Radar Gun,MIDAR,Tree NET等典型方法相比,所提算法的正确率分别平均提高约15.8%、4.8%、5.7%,耗时分别最多降低约77.8%、65.3%、55.2%。4、归属于某一城市的同质地址块可用于目标IP定位,提出一种面向IP定位的同质地址块识别算法。首先,对于特定目标区域,获取多个IP位置数据库位置一致的IP及区域内的地标作为目标;然后,将包含目标IP的/31作为候选地址块,部署探测源对块内IP探测,获取时延、路径信息,结合本文所提别名解析算法对路径中路由IP进行别名归并;其次,根据所设计的判别条件对候选地址块的同质性进行判别;接着,结合本文所提城市网络拓扑边界路由IP识别算法,分析块内IP的城市级位置,对同质地址块是否归属于一个城市进行判断;最后,逐级扩展同质地址块的大小并继续对新地址块进行判别,直至识别出包含目标IP的归属于某一城市的最大同质地址块。在中国、美国的多个城市进行了同质地址块识别实验,结果表明:所提算法对同质地址块识别的准确率较高,块内IP位置准确率最高约99.4%,将所识别的同质地址块应用于目标IP定位,对探测可达目标的定位准确率平均约95.7%;将同质地址块应用于网络地标扩展,可明显提升地标的数量,从而提升现有定位算法的成功率。5、特定区域内完整的PoP对于目标IP定位非常重要,提出一种面向IP定位的高完整性PoP划分算法。首先,对于特定区域,获取多个数据库位置一致的IP,结合本文所提同质地址块识别算法获取的地标,作为目标IP;然后,部署探测源对目标IP探测,获取时延、路径,结合本文所提边界IP识别算法,获取区域内路由节点;其次,对路由节点进行子网分析,获取子网IP并继续探测,从探测路径中获取区域内新路由节点,对新节点继续进行子网分析、子网IP探测、路由节点获取,迭代上述过程,直至不再能获取大量新节点;接着,结合本文所提别名解析算法,对区域内所有路由节点进行别名归并;最后,提取大量具有公共节点的Bi-fan结构并划分PoP。在中国河南省、美国佛罗里达州进行了PoP划分及IP定位实验,结果表明:相比于PoP-Geo、PoP-NTA等现有典型方法,所提算法获取的PoP包含节点数量更多,完整性更高,分别最大提高约5.2、4.2倍,将这些高完整性的PoP应用于IP定位,失败率最低仅约0.6%,有望对部分探测不可达但路径经过PoP的目标IP进行定位。最后,对全文的工作进行了总结,并指出了需要进一步研究、解决的问题。