论文部分内容阅读
随着云计算与大数据等分布式网络技术的飞速发展且日益完善,海量数据信息的安全处理、安全存储以及安全传输成为了当今全球性关注的问题。针对存储数据的完整性、可靠性以及机密性三大基本安全需求,研究人员在分布式存储体系架构下进行了深入的研究,并在新型的审计技术、编码技术和加密技术方面取得了重要成果。尽管如此,现有的成果在安全性、理论性与实用性方面仍然面临着不少的挑战,比如:公共审计的安全假设、动态操作的潜在隐患、存储数据的隐私保护、以及新型编码的理论研究等方面。因此,如何应对分布式存储数据面临的安全威胁,提供相应的数据安全保障机制,并详尽分析和改善现有的数据安全存储模型,是本文主要的研究内容。 本文以分布式存储系统数据安全与编码技术为研究对象,围绕分布式存储数据面临的主要安全挑战,在总结分析已有技术方案以及理论成果的基础上,深入剖析并开展了基于信息反馈的审计方案、动态更新数据的安全存储、基于新型编码的隐私保护、及其相关新型编码的理论分析等研究。具体地,本文所取得的研究成果如下: 1.提出了一种面向不可信第三方的数据完整性保护方案。现有的公共审计方案总是假设第三方审计者是可信或半可信的,但是在实际的数据完整性校验情形中,审计第三方可能是恶意的,进而会直接影响最后的验证结果。为此,我们提出基于信息反馈的安全计算代理审计模型,通过向第三方转移主要的计算任务,实现了用户自身能高效简洁地完成审计需求的功能。 2.提出了一种基于再生码的动态更新数据安全存储模型。对于实际的数据存储平台,数据经常需要动态的删除、添加及更新等操作。由于存储数据的冗余结构,动态操作势必会影响所有相关的数据块。此外,倘若攻击者针对性地破坏动态变化的数据块,那么必然会导致相应数据遭遇永久性的不可恢复。因此,我们提出基于系统再生码的动态数据可恢复性证明方案,利用随机置换以及捆绑更新等技术,保证了数据能以高置信概率完成安全高效的动态操作。 3.刻画了基于最小存储再生码(MSR码)存储系统的数据隐私保护能力。MSR码作为最小存储的最优再生码,具有广泛的实际应用价值。然而,由于MSR码单节点的存储容量严格小于相应的修复带宽,在拓展的窃听模型下,其隐私保护能力的刻画一度被认为是业界公开的研究问题。针对这一问题,我们从信息论的角度出发,结合相关有限域知识,在分布式存储架构下,深入研究了MSR码内在的信息论特性,最终给出了其隐私保护能力的具体刻画。 4.分析了基于最小存储合作再生码(MSCR码)存储系统的数据隐私安全。MSCR码是能同时有效修复多个失效节点的最小存储合作再生码,适用于多数实际的分布式存储应用情形。同样在拓展的窃听模型下,设计具有隐私保护的MSCR码,将有重要的实用价值。然而,对于MSCR码而言,修复数据可能会随着不同的失效节点群或帮助节点集而变化,从而造成更多的数据信息泄露。为此,我们提出了“稳定”MSCR码的概念。通过分析现有的两类MSCR码,发现它们都不稳定,并且我们证明了其中一类不具有任何数据隐私保护能力,而另一类可以转化为稳定的MSCR码。利用信息论,我们进一步刻画了某些情形下稳定MSCR码的隐私保护能力。 5.改进了线性系统MSR码系统长度的上界。实际应用中,鉴于数据的计算复杂度及访问读取代价,线性系统的MSR码最受青睐。然而,由于MSR码本身的特性加上额外的线性和系统性质,线性系统MSR码的单节点存储容量、校验节点数量、以及系统长度三个参数之间存在着天然的制约关系。针对这一公开问题,我们沿用干扰对齐的原理以及线性子空间和线性算子的技术,通过验证原有编码矩阵的独立性和构造线性独立的新矩阵,给出了系统长度改进的上界,从而进一步加深了对线性系统MSR码构造原理的认识。 以上成果在分析分布式存储系统数据安全需求的基础上,提出了针对已有技术方案潜在隐患的防护机制,深入研究并回答了分布式存储编码理论的若干重要问题,对推动分布式存储系统的安全应用具有重要的理论意义和实际价值。