论文部分内容阅读
网格计算作为一种新型的大型分布式计算,从其提出到现在一直受到了学术界和工业界极大的关注。随着网格技术的不断发展,网格已逐步发展细化为计算网格、数据网格、服务网格以及设备网格等多种形态。在处理大型数据的数据网格环境中,让所有用户访问数据的单一实例在性能上是不可行的,基于减少带宽消耗和提高数据访问速度等方面的考虑,解决以上问题的一个有效的方法是将所要访问的数据集进行复制,作为数据集的副本放置在数据网格的不同站点中。系统如何用最小的代价选取最合适的副本成为迫切需要解决的问题,即数据网格中的副本选择问题。本文就是基于数据网格中的副本选择问题所做的研究,所做的主要工作如下:(1)讨论了现有的副本选择策略:基于经济学模型和群智能理论方法,重点研究了基于群智能理论的副本选择策略,包括基于模拟退火算法、遗传算法和蚂蚁算法的副本选择策略。(2)在基于遗传算法和蚂蚁算法的副本选择策略研究的基础上,针对两种算法的优缺点,提出了基于融合算法的副本选择策略,利用遗传算法中的适应度函数初始化蚂蚁算法中的信息素分布,利用蚂蚁算法选择最优副本,即解决了遗传算法求解效率低的问题,又解决了蚂蚁算法初期信息素匮乏问题。(3)为了评估新的副本选择策略的性能,选择了数据网格模拟器OptorSim进行仿真模拟。扩充了仿真模拟器OptorSim,在其中加入蚂蚁算法、遗传算法和融合算法三种副本优化算法,并对三种算法以及OptorSim自带的SimpleOptimiser算法的仿真结果进行图形化显示。通过对仿真结果进行分析比较,得出了基于融合算法的副本选择策略在整个网格环境下和在单个站点都能有效减少作业运行时间,提高副本选择的速度,从而提高整体性能。结尾部分总结了本文的研究工作,并对以后的工作进行了展望。