论文部分内容阅读
在当今信息化社会,数据是一个企业或组织最宝贵的财富,关键数据的损坏或丢失都将给企业带来毁灭性打击。而数据在各类自然灾害、人为误操作、病毒及黑客攻击等破坏面前都显得极为脆弱,数据备份技术作为数据保护的有效手段,正在得到日益广泛的应用。随着云计算和SaaS(软件即服务)方式的兴起,备份服务正在逐步替代传统的备份软件,成为存储应用领域一个新的发展方向。当前备份软件及服务市场基本由国外产品所垄断,对相关的关键技术展开研究并开发具有自主知识产权的备份服务系统对保障我国的信息系统安全具有十分重要的意义。针对如何提高在线备份服务系统中的大规模用户与多介质节点之间并发数据流的传输与存储负载均衡问题,研究了调度服务器的任务并发调度技术。在宏观层面,提出了一种实时调度策略和一种全程调度策略,用于建立多用户节点与多存储节点之间的高效连接与数据传输,对两种策略及其适用范围进行了对比分析;在微观层面,研究了任务处理中的多线程管理机制,针对目前采用的ad-hoc方式,提出了一种改进的线程池方式。针对如何提高海量备份数据的传输与存储效率问题,论文重点研究了在线备份服务系统中存储服务器内部的数据组织方法,以及涵盖备份客户端与存储服务器的数据压缩技术。对于数据组织,节点间的存储文件相对独立,节点内的存储文件按需动态增长,文件内部的数据按块存储,不同数据块通过hash进行索引。对于数据压缩,提出了一种复合数据压缩方法,包括两个层次:底层采用块级压缩,数据备份时,如果判断存储服务器中不存在相应的数据块,则备份客户端先对该块进行数据流式压缩,然后再进行传输,这样可以有效去除文件内部的重复数据流;上层采用全局压缩,备份操作中,对于存储服务器存在的数据块,无须重传副本,只需修改存储服务器中的数据块的索引即可,这样可以实现多用户不同文件间的重复数据删除。最后利用三种常用的块级压缩算法对压缩率及CPU利用率进行了实验验证。由于在线备份服务系统比备份软件存在更多的技术问题,客观上更易产生异常,而主观上又要求更高的服务可信性,所以最后研究了在线备份服务系统的可信性问题。首先研究了可信性概念、可信性分析及改进理论,在此基础上,提出了容错在线备份服务模型(FOBSM),并用形式化语言Object-Z对FOBSM的各个组成构件进行了形式化建模,利用Object-Z的推理规则证明了FOBSM所具有的容错属性,该研究对在线备份服务系统的容错设计具有指导意义。在上述研究的基础上,设计并实现了一个在线备份服务原型系统。