论文部分内容阅读
云计算(cloud computing)通过互联网提供动态易扩展的虚拟化资源服务方式,为大数据存储和管理提供了全新的模式。越来越多的用户数据被存放到云服务器,使得这些数据所有者在享受这种便利服务的同时也丧失了对数据的实际控制权。尤其是当数据存放在不可信的云服务提供者的服务器中时常面临数据遭受丢失或损坏的威胁,数据完整性校验成为解决这一问题的重要手段。大数据存储下的数据完整性校验目前以简单随机抽样方法来进行抽样校验。具体实施时首先将文件划分成一定数量的数据块进行随机抽取,以应对数据频繁更新时可能出现的潜在数据丢失或损坏。然而这种抽样方法在处理数据块的连续丢失或损坏时显得有些滞后。为此,本文以保证数据校验可公开性和安全性的三方校验模型为基础,提出一种基于随机马尔科夫决策过程的抽样校验方法。通过分析每个独立数据块的状态和损坏数据块之间的关联性,采用随机马尔科夫决策过程来制定数据块在校验中的抽取策略,以解决简单随机校验方案在数据块发生连续丢失或损坏情况时发现时间长的问题。此外,从抽样数据块数量、校验轮数和校验时间间隔等方面进行了进一步的抽样校验优化。最后,通过理论分析和实验分析,在数据完整性校验中采用基于随机马尔科夫决策过程的数据抽样算法,在计算代价和网络传输开销相同的条件下,面对连续损坏的数据块,校验同等数量数据坏块时所需要的校验时间明显减少,在同等校验时间时所检测到的数据坏块数量明显增多。而在面对非连续损坏的数据块时,所需校验时间和检测到的数据坏块数量相似,因此,本文提出的数据抽样算法提升了数据完整性校验的效率。