论文部分内容阅读
摘 要:信息中心网络(ICN)已经展现出可以解决多种网络问题的趋势。与此同时,信息中心网络还有许多问题需要去解决,以推进这个非常有前途的架构。在这篇文章中,我们主要讨论两个问题:1)如何定位或选择网络中的节点作为缓存节点;2)缓存节点缓存什么样的内容使得缓存利用率较高。这篇文章通过介绍基于势能的缓存算法,使得在任意图网路中通过合理分配缓存节点和缓存内容达到较高的缓存利用率。通过和CATT的比较,请求节点的接入代价降低,内容路由器命中率增加。
关键词:信息中心网络;流媒体;缓存;缓存片段
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)06-0213-03
Potential Based Streaming Media with Content Caching for ICN
YOU Zhi-gang
(School of Software Engineering,Tongji University,Shanghai 201804,China)
Abstract:ICN(Information Centric Networking ) has shown the trend that can solve the problem of multiple network. Meanwhile, there are many problems need to solve, in order to promote this very promising architecture. In this paper, we mainly discuss two problems: how to locate or select node to cache the distributed contents? And how are these content distributed or cached by taking advantage of cache in network? The paper through introducing the cache algorithm based on potential that achieve high cache utilization by reasonable distribution of the cache in network nodes in arbitrary topology.Through the comparison with CATT , the algorithm had make that the access cost of nodes in network reduced and increase the cache hit ratio.
Key words:ICN (Information Centric Networking); streaming media; caching; chunk
根据Cisco公司预测,在2013-2018年期间,全球互联网用户将从25亿增长到近40亿(将超过全球人口的51%),全球的网络设备和连接数量也将从2013年的120亿增长到210亿[1]。互联网应用已经由端对端的通信模式向内容获取模式转变,通信与互联网模式不再是用户对用户,而是用户对数据。TCP/IP协议架构已经无法适应这种转变,这样ICN就孕育而生。
在ICN中,用户只关系请求内容本身,而不在乎请求内容的位置[1][2][6]。ICN要求网络中每一个节点都有缓存功能,覆盖全网的缓存成为ICN网络体系的一个重要部分。基于请求内容名字路由的方式使得网络中的每个节点都能对请求内容进行响应。网络不在只是一个传输体,而且已然是一个存储体[9]。
缓存网络建模的目的是对缓存系统进行适度的抽象和简化,建立相应的理论模型并进行分析,为缓存行为提供理论支撑。在Web缓存出现以后,缓存网络的建模一般面向的是一些特殊的网络拓扑结构,比如线性的级联网络或是层次的树状结构[1]。为了最大程度的发挥缓存在ICN网络体系中的优势,设计一个高效的缓存机制是关键。这这篇文章当中,我们主要围绕下面两个问题:
1)确定哪些内容的作为节点的缓存及其位置。
2)怎样充分利用好缓存。
针对以上这些问题,我们将在网状结构的任意图上进行解析分析,设计出一套缓存的解决方案-基于势能的缓存算法
1 相关工作
1.1 CATT
CATT(potential based routing with content caching for icn)[6]是一个基于势能的内容路由方式,事先通过控制层面的扩散,建立相应的路由表。对于给定的文件对象C,给定的网络节点n,给定的缓存有c的网络节点nc,定义了n受到nc的势能影响,影响值与两节点之间的距离成反比,而与文件c的质量成正比。文件c的质量可以解释为节点nc的处理能力和吞吐量。而在整个网络中,n受到的势能影响可以定义为所有缓存有文件c的节点对节点n的势能影响之和。CATT的路由方式为:当请求到达节点n时,如果没有命中文件,则选取与n的势能差最大的邻居节点转发请求。在CATT中,定义了两类势场:
在实际的系统采用上述两种势场的组合,从而有效的平衡了对象可用性和系统可扩展性。
缺点:没有充分考虑到chunk粒度的相关性,(缓存的聚集问题)。
2 基于势能的缓存算法
2.1 假设
我们可以假设在网络中的节点可以作为内容请求节点,也可以利用网络存储体的性质,作为内容路由缓存文件的chunk。我们也假设原始服务器(文件内容分发)作为一个缓存不会被替换的内容路由,可以推荐下游结点缓存chunk。 在任意图网络中,节点之间没有明确的层次关系。我们假设在最初的状态下,网络中的内容路由器内容路由表都为空,用户内容请求消息是通过泛洪的方式来传输请求至原始服务器的,随着请求内容的沿路径返回,内容路由表逐步更新,而在沿路径的内容的缓存使得用户请求内容能够得到更加快速的响应。沿路径缓存的节点主要的判断标准是通过返回路径中节点所受周围节点内容势能影响决定的,选取受到周围节点势能影响最大的节点作为缓存节点,使得相同的内容文件片段能够聚集在相对集中的范围内。
2.2 基于势能的缓存分配算法
为了更加贴切的模仿现实网络,不能简单的用层次结构来代替现实网络,所以我们把网络放置在任意图中展示:
缓存算法的树形结构如图1所示,存在一个初始服务器,存在一些用户节点和一些内容路由器,我们假设每一个内容文件都是由10个chunk组成,服务器中包含了这些文件,这些文件请求都由用户节点发起。
1)终端N1发送请求,请求文件A,将通过泛洪到达初始服务器。
2)在请求到达后,初始服务器响应请求,这个第一次对文件A的请求,在从节点N1到服务器N1之间不存在缓存,在这条路径上所有的节点都拥有相同的势能影响,所以在这条路径中随机选择一个节点作为缓存节点,在图1中,在响应的时候,一部分chunks将被缓存在N4节点上,并更新邻居节点的路由表。
3) 假设N2请求相同的文件A,将在到服务器的路径的节点N4得到文件的一部分chunks,其余部分将从服务器得到。
4) 在响应请求后,返回到N2的路径中,只有一个节点N4缓存了文件的内容,所以上游的节点N5和下游的节点N3受到最大的势能影响,所以在响应返回时,将一部分缓存到N3和N5上。
5) 其他节点在请求相同的内容,相同的内容在一定范围内的区域缓存的数量较多,如果在该区域附近的用户请求内容较多的话,能够更快的得到相应。
3 仿真实验
如上文所述,与本文相关的研究包括chunk的缓存及其流动,我们从中选择代表性的策略座位性能比较的对象:最近提出来的CATT,本文采用多个性能参数进行对比,其中包括平均接入代价、缓存命中率、替换数量等,我们接下来将会研究各个网络参数对性能的影响,如缓存大小、内容数量、节点数量、Zipf参数(α)等
3.1 性能参数
采用用了peersim基于cycle驱动来模拟本次实验。ICN网络作为一个任意图结构,在任意图网络中,有100个节点,每个节点都拥有相同的为4的度。初始服务器存放有100个不同的文件,节点通过信息请求的形式在网络中请求所需要的信息。用户请求的信息服从α=0.85的ZIPF分布。
表1列出了本文主要的实验参数以及默认值。
3.2 实验结果
本节给出的实验结果,都是通过10次实验后得到的平均。
3.2.1 接入代价
图2显示,随着任意图网络中的节点的增加,基于势能的缓存算法和CATT的接入代价都在不断升高,而且CATT接入代价增长速度比基于势能的缓存算法要快很多。而从图3中我们可以看到,基于势能的缓存算法中,命中数基本上都在98%以上,而CATT却在任意图结构中表现一般。
如图4所示,平均跳数指明了在任意图中请求的接入代价的平均值,可以看到,CATT的平均接入代价整体高于基于势能的缓存算法,整体提高了6%,但是由于基于势能的缓存是的任意图网络节点请求的命中数提高很多,所以整体性能更好。
3.2.2 缓存命中率
缓存命中率是考查缓存效率的主要因素,缓存命中率越高,缓存的效率也就越高,图5中看出,在100-400个节点之间,基于势能的缓存算法比CATT分别高出32.2%、23.4%、8%。
3.2.3 缓存被替换数
缓存替换数越高表示网络中的缓存越不稳定,对于一个资源有限的路由器来说,这些消耗显然会影响到路由器的转发和其他任务的完成。基于势能的缓存算法虽然命中率和接入代价比CATT更加优秀,但是在缓存替换更加的频繁,导致能源无谓的浪费,这个问题需要及时解决。
4 结论
通过对基于势能的流媒体缓存对象的研究,使得在ICN任意图网络中请求的接入代价、缓存命中数都得到了较大的提高,但是由于缓存节点较多,所以缓存替换数响应增加,以后的研究将着手于流媒体中chunk之间影响、chunk数量的影响和Zipf的α值的影响,从而达到接入代价、缓存命中率和缓存替换的性能整体提升。
参考文献:
[1] 张国强, 李杨, 林涛, 等. 信息中心网络中的内置缓存技术研究[J]. 软件学报, 2014, 25(1): 154-175.
[2] Chai W K, He D, Psaras I, et al. Cache “less for more” in information-centric networks[M]//NETWORKING 2012. Springer Berlin Heidelberg, 2012: 27-40.
[3] Chai W K, He D, Psaras I, et al. Cache “less for more” in information-centric networks (extended version)[J]. Computer Communications, 2013, 36(7): 758-770.
[4] 叶润生, 徐明伟. 命名数据网络中的邻居缓存路由策略[J]. 计算机科学与探索, 2012, 6(7): 593-601.
[5] 闵二龙, 陈震, 许宏峰, 等.内容中心网络 CCN 研究进展探析[J]. 信息网络安全, 2012 (2): 6-10.
[6] 林闯, 贾子骁, 孟坤. 自适应的未来网络体系架构[J]. 计算机学报, 2012, 35(6): 1077-1093.
[7] Diallo M, Fdida S, Sourlas V, et al. Leveraging caching for Internet-scale content-based publish/subscribe networks[C]//Communications (ICC), 2011 IEEE International Conference on. IEEE, 2011: 1-5.
[8] Psaras I, Chai W K, Pavlou G. Probabilistic in-network caching for information-centric networks[C]//Proceedings of the second edition of the ICN workshop on Information-centric networking. ACM, 2012: 55-60.
[9] 刘外喜, 余顺争, 蔡君, 等. ICN 中的一种协作缓存机制[J]. 软件学报, 2013, 24(8).
关键词:信息中心网络;流媒体;缓存;缓存片段
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)06-0213-03
Potential Based Streaming Media with Content Caching for ICN
YOU Zhi-gang
(School of Software Engineering,Tongji University,Shanghai 201804,China)
Abstract:ICN(Information Centric Networking ) has shown the trend that can solve the problem of multiple network. Meanwhile, there are many problems need to solve, in order to promote this very promising architecture. In this paper, we mainly discuss two problems: how to locate or select node to cache the distributed contents? And how are these content distributed or cached by taking advantage of cache in network? The paper through introducing the cache algorithm based on potential that achieve high cache utilization by reasonable distribution of the cache in network nodes in arbitrary topology.Through the comparison with CATT , the algorithm had make that the access cost of nodes in network reduced and increase the cache hit ratio.
Key words:ICN (Information Centric Networking); streaming media; caching; chunk
根据Cisco公司预测,在2013-2018年期间,全球互联网用户将从25亿增长到近40亿(将超过全球人口的51%),全球的网络设备和连接数量也将从2013年的120亿增长到210亿[1]。互联网应用已经由端对端的通信模式向内容获取模式转变,通信与互联网模式不再是用户对用户,而是用户对数据。TCP/IP协议架构已经无法适应这种转变,这样ICN就孕育而生。
在ICN中,用户只关系请求内容本身,而不在乎请求内容的位置[1][2][6]。ICN要求网络中每一个节点都有缓存功能,覆盖全网的缓存成为ICN网络体系的一个重要部分。基于请求内容名字路由的方式使得网络中的每个节点都能对请求内容进行响应。网络不在只是一个传输体,而且已然是一个存储体[9]。
缓存网络建模的目的是对缓存系统进行适度的抽象和简化,建立相应的理论模型并进行分析,为缓存行为提供理论支撑。在Web缓存出现以后,缓存网络的建模一般面向的是一些特殊的网络拓扑结构,比如线性的级联网络或是层次的树状结构[1]。为了最大程度的发挥缓存在ICN网络体系中的优势,设计一个高效的缓存机制是关键。这这篇文章当中,我们主要围绕下面两个问题:
1)确定哪些内容的作为节点的缓存及其位置。
2)怎样充分利用好缓存。
针对以上这些问题,我们将在网状结构的任意图上进行解析分析,设计出一套缓存的解决方案-基于势能的缓存算法
1 相关工作
1.1 CATT
CATT(potential based routing with content caching for icn)[6]是一个基于势能的内容路由方式,事先通过控制层面的扩散,建立相应的路由表。对于给定的文件对象C,给定的网络节点n,给定的缓存有c的网络节点nc,定义了n受到nc的势能影响,影响值与两节点之间的距离成反比,而与文件c的质量成正比。文件c的质量可以解释为节点nc的处理能力和吞吐量。而在整个网络中,n受到的势能影响可以定义为所有缓存有文件c的节点对节点n的势能影响之和。CATT的路由方式为:当请求到达节点n时,如果没有命中文件,则选取与n的势能差最大的邻居节点转发请求。在CATT中,定义了两类势场:
在实际的系统采用上述两种势场的组合,从而有效的平衡了对象可用性和系统可扩展性。
缺点:没有充分考虑到chunk粒度的相关性,(缓存的聚集问题)。
2 基于势能的缓存算法
2.1 假设
我们可以假设在网络中的节点可以作为内容请求节点,也可以利用网络存储体的性质,作为内容路由缓存文件的chunk。我们也假设原始服务器(文件内容分发)作为一个缓存不会被替换的内容路由,可以推荐下游结点缓存chunk。 在任意图网络中,节点之间没有明确的层次关系。我们假设在最初的状态下,网络中的内容路由器内容路由表都为空,用户内容请求消息是通过泛洪的方式来传输请求至原始服务器的,随着请求内容的沿路径返回,内容路由表逐步更新,而在沿路径的内容的缓存使得用户请求内容能够得到更加快速的响应。沿路径缓存的节点主要的判断标准是通过返回路径中节点所受周围节点内容势能影响决定的,选取受到周围节点势能影响最大的节点作为缓存节点,使得相同的内容文件片段能够聚集在相对集中的范围内。
2.2 基于势能的缓存分配算法
为了更加贴切的模仿现实网络,不能简单的用层次结构来代替现实网络,所以我们把网络放置在任意图中展示:
缓存算法的树形结构如图1所示,存在一个初始服务器,存在一些用户节点和一些内容路由器,我们假设每一个内容文件都是由10个chunk组成,服务器中包含了这些文件,这些文件请求都由用户节点发起。
1)终端N1发送请求,请求文件A,将通过泛洪到达初始服务器。
2)在请求到达后,初始服务器响应请求,这个第一次对文件A的请求,在从节点N1到服务器N1之间不存在缓存,在这条路径上所有的节点都拥有相同的势能影响,所以在这条路径中随机选择一个节点作为缓存节点,在图1中,在响应的时候,一部分chunks将被缓存在N4节点上,并更新邻居节点的路由表。
3) 假设N2请求相同的文件A,将在到服务器的路径的节点N4得到文件的一部分chunks,其余部分将从服务器得到。
4) 在响应请求后,返回到N2的路径中,只有一个节点N4缓存了文件的内容,所以上游的节点N5和下游的节点N3受到最大的势能影响,所以在响应返回时,将一部分缓存到N3和N5上。
5) 其他节点在请求相同的内容,相同的内容在一定范围内的区域缓存的数量较多,如果在该区域附近的用户请求内容较多的话,能够更快的得到相应。
3 仿真实验
如上文所述,与本文相关的研究包括chunk的缓存及其流动,我们从中选择代表性的策略座位性能比较的对象:最近提出来的CATT,本文采用多个性能参数进行对比,其中包括平均接入代价、缓存命中率、替换数量等,我们接下来将会研究各个网络参数对性能的影响,如缓存大小、内容数量、节点数量、Zipf参数(α)等
3.1 性能参数
采用用了peersim基于cycle驱动来模拟本次实验。ICN网络作为一个任意图结构,在任意图网络中,有100个节点,每个节点都拥有相同的为4的度。初始服务器存放有100个不同的文件,节点通过信息请求的形式在网络中请求所需要的信息。用户请求的信息服从α=0.85的ZIPF分布。
表1列出了本文主要的实验参数以及默认值。
3.2 实验结果
本节给出的实验结果,都是通过10次实验后得到的平均。
3.2.1 接入代价
图2显示,随着任意图网络中的节点的增加,基于势能的缓存算法和CATT的接入代价都在不断升高,而且CATT接入代价增长速度比基于势能的缓存算法要快很多。而从图3中我们可以看到,基于势能的缓存算法中,命中数基本上都在98%以上,而CATT却在任意图结构中表现一般。
如图4所示,平均跳数指明了在任意图中请求的接入代价的平均值,可以看到,CATT的平均接入代价整体高于基于势能的缓存算法,整体提高了6%,但是由于基于势能的缓存是的任意图网络节点请求的命中数提高很多,所以整体性能更好。
3.2.2 缓存命中率
缓存命中率是考查缓存效率的主要因素,缓存命中率越高,缓存的效率也就越高,图5中看出,在100-400个节点之间,基于势能的缓存算法比CATT分别高出32.2%、23.4%、8%。
3.2.3 缓存被替换数
缓存替换数越高表示网络中的缓存越不稳定,对于一个资源有限的路由器来说,这些消耗显然会影响到路由器的转发和其他任务的完成。基于势能的缓存算法虽然命中率和接入代价比CATT更加优秀,但是在缓存替换更加的频繁,导致能源无谓的浪费,这个问题需要及时解决。
4 结论
通过对基于势能的流媒体缓存对象的研究,使得在ICN任意图网络中请求的接入代价、缓存命中数都得到了较大的提高,但是由于缓存节点较多,所以缓存替换数响应增加,以后的研究将着手于流媒体中chunk之间影响、chunk数量的影响和Zipf的α值的影响,从而达到接入代价、缓存命中率和缓存替换的性能整体提升。
参考文献:
[1] 张国强, 李杨, 林涛, 等. 信息中心网络中的内置缓存技术研究[J]. 软件学报, 2014, 25(1): 154-175.
[2] Chai W K, He D, Psaras I, et al. Cache “less for more” in information-centric networks[M]//NETWORKING 2012. Springer Berlin Heidelberg, 2012: 27-40.
[3] Chai W K, He D, Psaras I, et al. Cache “less for more” in information-centric networks (extended version)[J]. Computer Communications, 2013, 36(7): 758-770.
[4] 叶润生, 徐明伟. 命名数据网络中的邻居缓存路由策略[J]. 计算机科学与探索, 2012, 6(7): 593-601.
[5] 闵二龙, 陈震, 许宏峰, 等.内容中心网络 CCN 研究进展探析[J]. 信息网络安全, 2012 (2): 6-10.
[6] 林闯, 贾子骁, 孟坤. 自适应的未来网络体系架构[J]. 计算机学报, 2012, 35(6): 1077-1093.
[7] Diallo M, Fdida S, Sourlas V, et al. Leveraging caching for Internet-scale content-based publish/subscribe networks[C]//Communications (ICC), 2011 IEEE International Conference on. IEEE, 2011: 1-5.
[8] Psaras I, Chai W K, Pavlou G. Probabilistic in-network caching for information-centric networks[C]//Proceedings of the second edition of the ICN workshop on Information-centric networking. ACM, 2012: 55-60.
[9] 刘外喜, 余顺争, 蔡君, 等. ICN 中的一种协作缓存机制[J]. 软件学报, 2013, 24(8).