论文部分内容阅读
云存储的概念是随着云计算的发展而出现的。本文对云存储机制进行研究,分析了云存储系统中的数据存储方式及数据的访问方式。在云存储环境当中,数据都是以多备份、固定大小数据块的形式存储在云集群服务器中,而所有数据块都是以文件的形式存储在Linux环境下。系统中有一个中心主节点,所有对数据块的操作都是通过它进行协调。本文所做的主要工作包括:通过对云存储环境的网络拓扑结构和基于地理位置信息的各服务器位置关系的分析,得到数据块集合在云环境下层次化网络拓扑结构分布图。通过对数据块集合结构分布图的分析,提出了云存储环境中存储资源的风险评估模型,并给出了具体的风险计算算法和实例分析,为在云存储环境中对基于存储资源的风险研究提供了理论依据。针对云存储环境进行系统建模,形式化数据块资源和服务器资源的一些属性,分析集合划分问题在资源分布中的重要性并给出了在集合划分问题中使用方差衡量问题目标的数学证明。通过对云存储系统数据块资源属性的研究,对云存储系统中数据块资源的分布问题进行数学建模,并提出基于云集群服务器性能的数据块分布算法LPT-IGA.LPT-IGA算法是在LPT算法的基础上改进的遗传算法。算法首先改进遗传算法初始种群的产生,使用LPT算法生成问题的许多解,然后使用基于适应度值的轮盘赌选择算法选择得到遗传算法的初始种群;其次,对编码进行改进,所有编码的方向都是按照数据块资源的被访问频率(热度)由大到小的方向编码;最后,对交叉操作和变异操作提出一种随机地按照编码方向逐渐增大概率的改进方法进行交叉和变异操作。针对云集群中数据块服务器效能的优化问题,首先对云集群环境当中的服务器效能最大化问题进行数学建模,在此数学模型的基础上给出FFD-LPT的近似算法。FFD-LPT算法改进了DLPT算法二分搜索的上界,使算法的搜索空间较小。