论文部分内容阅读
【摘要】传统数字档案信息存储在技术结构、存储方案、数据备份和灾难恢复等方面存在着不足,云存储以其独特的技术和理念优势,有助于弥补这些不足之处。根据云存储体系的架构方案,笔者对“云”环境下的数字档案信息存储方案设计的前提条件、原则以及体系构架提出了自己的看法。
【关键词】云计算;云存储;数字档案信息;存储方案
随着信息社会的不断深入和网络IT技术的迅速发展,传统数字档案信息存储在技术结构、存储方案、数据备份和灾难恢复等方面显得越来越难以适应档案工作现代化的需要,也越来越不能满足用户对其个性化高层次的需求。档案部门如何突破数字档案信息存储的现有条件制约,解决其在存储容量、资源共享、满足用户个性化服务等方面所面临的难题。作为云计算重要组成部分并集合了集群应用、网格技术、分布式技术等众多技术的云存储技术,有望能为档案部门带来新的机遇和突破。
一、数字档案信息存储的现状
(一)数字档案信息存储的技术结构。依据存储设备在构成数字网络系统中的结构,可将数字档案信息存储的技术结构分为三类,即DAS(直接连接存储)、NAS(网络连接存储)、SAN(存储区域网)。
1.DAS存储结構。DAS是指将存储设备通过SCSI接口或光纤通道直接连接到服务器上。随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列的硬盘数量越来越多,SCSI通道将会成为IO瓶颈;服务器主机SCSIID资源有限,能够建立的SCSI通道连接有限。随着档案数字化建设的不断发展,存储容量的增多,访问用户量增大,DAS存储技术将逐渐被淘汰。
2.NAS存储结构。NAS采用网络技术,通过网络交换机连接存储系统和服务器主机,建立专用于数据存储的存储私网。虽然NAS存储结构具有即插即用、较强的可扩展性、异类文件共享等优点,但附网存储设备直接与以太网连接,其安全性存在一定问题,而且该结构在LAN上存储大批数据可能会占用大量的带宽,增加了网络负载。
3.SAN存储结构。SAN是一种高速网络或子网络,可以提供在计算机与数字档案信息存储系统之间的数据传输。一个SAN 网络由负责网络连接的通信结构、负责组织连接的管理层、存储部件以及计算机系统构成,从而保证数据传输的安全性和力度。通常SAN与其它计算资源紧密集群来实现数字档案信息远程备份和档案存储过程。SAN支持磁盘镜像技术、备份与恢复、档案数据的存档和检索、存储设备间的数据迁移以及网络中不同服务器间的数据共享等功能。虽然SAN功能强大,但许多设备价格高昂并难以维护,使很多档案部门只能“望SAN兴叹”。
(二)数字档案信息的“双套制”存储方案。双套制融合了纸质档管理和数字档案管理的优势,既可发挥高效存取检索功能,又可在最大限度上保障数字档案信息的安全长期存储。然而,双套制意味着每份文件都必须对电子和纸质两个版本同进行保存管理,投入双倍的人力、物力、财力,大大增加档案部门的经济负担。同时,双套制没有考虑到文件在其生命周期中,尤其是在办理过程中会留下各种各样痕迹,例如领导的批示、签字等。这些重要的痕迹内容就没有在上述纸质副本中体现出来,导致该副本的真实性和完整性难以保证。
(三)数字档案信息的数据备份和灾难恢复问题。当前数字档案信息的数据备份一般是采用数据内置或外置的磁带机进行的冷备份,备份磁带同时也存放在本地的网管中心,一旦本地的网管中心出现了灾难,如空袭、战争、火灾、盗窃和地震等灾难时,这些备份磁带也随之俱毁,灾难数据恢复也就失去了前提。弥补冷备份不足的办法是采取异地实时备份,它在灾难发生时可以全面及时的恢复整个系统,但是这种备份策略投资比较大,对于经费一向拮据的档案部门缺乏可行性。
二、云存储及其运用于数字档案信息存储的优势
云存储是在云计算基础上延伸和发展出来的一个新概念,它是通过集群应用、网格技术或分布式文件系统等功能,将网络中大量不同类型的存储设备通过应用软件集合起来协同工作,共同提供数据存储和业务访问功能的一个系统。从根本上说,云存储不是存储,而是服务。人们使用云存储,并不是使用某一个存储设备,而是使用云存储系统带来的一种数据访问服务。总体来说,云存储运用于数字档案信息存储方面主要有以下优势:由成千上万台甚至更多服务器组成的集群具有无限空间,支持无限存储容量和超强扩展能力;用户不再需要购买和升级相关管理软件,只需要根据自己的需要和喜好来租用服务商的价格低廉的云服务,大大降低了数字档案信息存储成本;提供更容易的群组协作,增强各部门的沟通,有利于实现数字档案信息的共享;采用虚拟化技术,其物理设备可能分布在世界上的不同地点,帮助用户更为方便地形成多个异地备份。
三、基于“云”环境的数字档案信息存储方案构想
(一)方案设计的前提条件。主要有以下几个方面:
1.观念前提。档案人员必须认识到那种认为把资源放在自己眼下比放在云中更为安全可靠的想法是不科学的。档案人员一定要转变传统观念,认识到云计算技术和理念给档案信息化建设带来的机遇与挑战,在认真研究数字档案信息存储现状的基础上,结合云存储的优势,探索“云”环境下的数字档案信息存储方案。
2.管理前提。档案部门将云存储技术引入到数字档案信息存储领域必然会导致整个管理体制和管理方式的变革,同时会使整个部门的业务流程发生变化。因此,面临云计算浪潮的冲击,档案部门如何重新调整管理是一个摆在眼前的首要问题。
3.技术前提。云存储本身就是一个多设备、多应用、多服务协同工作的集合体,而将云存储应用到数字档案信息存储中,还要考虑到数字档案信息的特点,因此数字档案信息云存储的实现需要以多种技术发展为前提。这些技术主要包括,影响云存储性能的宽带网络技术,以共享为核心的Web2.0技术,保证存储系统高效运行的应用存储技术、集群技术、网格技术、虚拟化技术和分布式文件系统技术等。 (二)方案设计应该坚持的原则。主要内容如下:
1.在对原有存储系统充分整合的基础上,进行平滑迁移。云存储系统是要整合原有的存储系统,充分利用现有设备,在此基础上构建更大容量、更快响应速度的存储系统。因此,档案部门在准备将数据迁移到云端时,一定要充分利用原有存储系统,并做好扩容准备,满足数字档案信息的长期存储需求。同时,由于原有的存储系统对所处的生态环境已形成一定的依赖性,在向云端迁移时稍不注意就有可能造成数字档案信息的损坏或丢失。因此,系统迁移过程中一定要注意迁移的平滑性,尽可能保持数据的所处环境的安全稳定。
2.最大限度地保障数字档案信息的安全长期保存。数字档案信息的安全长期保存是存储方案设计的核心,也是难点。“云”环境下的数字档案信息存储方案的设计一定要从各方面最大限度地保障数字档案信息的安全长期保存。
3.保障数字档案信息的共享性,满足档案部门的各种存储需求。利用云存储的共享优势,解决数据存储的多样性和零散性,将地理位置分散的数字档案信息进行整合,形成具有统一逻辑视图的高性能数字档案信息云存储系统。同时,由于各地区档案部门在数字档案资源建设发展程度上有很大的差别,对数字档案信息资源的存储需求有很大不同,而且云存储中的存储设备多种多样,各种设备的性能根据资源的特点而有所差异。所以,在设计云存储方案时就要考虑到不同档案部门的差异化需求。
(三)数字档案信息的存储体系架构设想。笔者认为,参照云存储的体系架构,可以将“云”环境下的数字档案信息存储体系分为四层,分别为:存储层、基础管理层、应用接口层和用户访问层。
1.存储层。存储层是“云”环境下的数字档案信息存储架构的底层,也是存储的硬件层面。它为整个存储系统提供基本的网络环境、物理存储资源和逻辑存储资源。它通过网络把数量庞大且地理上分散的各种物理设备组合起来,用虚拟化技术屏蔽掉底层的硬件差异,使得档案部门以资源池的方式对外提供服务,并通过统一的管理逻辑和接口,进行存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护,确保硬件设施的安全与及时更新。
2.基础管理层。基础管理层是集群系统、分布式文件系统和网络分布技术的集成,它是“云”环境下的数字档案信息存储体系架构的核心层。通过集群、分布式文件系统、网格计算等技术,档案部门可以实现云存储中的多个存储设备间的协同工作,包括存储监控、调度,副本管理等,并根据档案部门的需求通过分布式文件系统在任何地点任何时刻向档案用户提供同一种数字档案信息服务,并保障了更强更好的数据访问性能,保证众多档案用户可以同时访问使用数字档案信息资源。
3.应用接口层。应用接口层是指利用云基础设施为用户提供各种应用软件部署和运行环境,并使根据用户需求开发出来的应用程序可以运行在这个环境之内,并且其生命周期被该环境所控制,而并非只是简单地调用平台提供的接口。应用层为档案用户提供了数字档案信息存储平台和各种个性化的Web服务,并用灵活简易的方式实现数字档案信息资源的聚合共享,同时可以对数字档案信息的安全备份和系统容灾进行全程监控。
4.访问层。经过授权,任何一个用户可以通过互联网终端设备随时随地地登录“云”环境下的数字档案信息存储系统,并对各种数字档案信息服务实行“一站式”浏览与体验,从而满足自己对数字档案信息的个性化需求。为了保障数字档案信息免遭非法用户的访问,云计算采用用户访问控制、身份认证、用户行为监测与审计等技术手段,对数字档案信息的安全性进行全方位的监控,以保障合法用户获取安全数字檔案信息的权利。
【参考文献】
[1]郎斌.档案数字化建设中信息资源存储系统的选择[J].兰台内外,2007(2):60~62.
[2]百度百科.SAN[2011-12-08].http://baike.baidu.com/view/120921.htm.
[3]张健.电子文件双套制存在的风险[J].北京档案,2009(3):25~26.
[4]李勇.云计算对信息服务的影响及存在的问题[J].情报理论与实践,2009(12):90~92.
【关键词】云计算;云存储;数字档案信息;存储方案
随着信息社会的不断深入和网络IT技术的迅速发展,传统数字档案信息存储在技术结构、存储方案、数据备份和灾难恢复等方面显得越来越难以适应档案工作现代化的需要,也越来越不能满足用户对其个性化高层次的需求。档案部门如何突破数字档案信息存储的现有条件制约,解决其在存储容量、资源共享、满足用户个性化服务等方面所面临的难题。作为云计算重要组成部分并集合了集群应用、网格技术、分布式技术等众多技术的云存储技术,有望能为档案部门带来新的机遇和突破。
一、数字档案信息存储的现状
(一)数字档案信息存储的技术结构。依据存储设备在构成数字网络系统中的结构,可将数字档案信息存储的技术结构分为三类,即DAS(直接连接存储)、NAS(网络连接存储)、SAN(存储区域网)。
1.DAS存储结構。DAS是指将存储设备通过SCSI接口或光纤通道直接连接到服务器上。随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列的硬盘数量越来越多,SCSI通道将会成为IO瓶颈;服务器主机SCSIID资源有限,能够建立的SCSI通道连接有限。随着档案数字化建设的不断发展,存储容量的增多,访问用户量增大,DAS存储技术将逐渐被淘汰。
2.NAS存储结构。NAS采用网络技术,通过网络交换机连接存储系统和服务器主机,建立专用于数据存储的存储私网。虽然NAS存储结构具有即插即用、较强的可扩展性、异类文件共享等优点,但附网存储设备直接与以太网连接,其安全性存在一定问题,而且该结构在LAN上存储大批数据可能会占用大量的带宽,增加了网络负载。
3.SAN存储结构。SAN是一种高速网络或子网络,可以提供在计算机与数字档案信息存储系统之间的数据传输。一个SAN 网络由负责网络连接的通信结构、负责组织连接的管理层、存储部件以及计算机系统构成,从而保证数据传输的安全性和力度。通常SAN与其它计算资源紧密集群来实现数字档案信息远程备份和档案存储过程。SAN支持磁盘镜像技术、备份与恢复、档案数据的存档和检索、存储设备间的数据迁移以及网络中不同服务器间的数据共享等功能。虽然SAN功能强大,但许多设备价格高昂并难以维护,使很多档案部门只能“望SAN兴叹”。
(二)数字档案信息的“双套制”存储方案。双套制融合了纸质档管理和数字档案管理的优势,既可发挥高效存取检索功能,又可在最大限度上保障数字档案信息的安全长期存储。然而,双套制意味着每份文件都必须对电子和纸质两个版本同进行保存管理,投入双倍的人力、物力、财力,大大增加档案部门的经济负担。同时,双套制没有考虑到文件在其生命周期中,尤其是在办理过程中会留下各种各样痕迹,例如领导的批示、签字等。这些重要的痕迹内容就没有在上述纸质副本中体现出来,导致该副本的真实性和完整性难以保证。
(三)数字档案信息的数据备份和灾难恢复问题。当前数字档案信息的数据备份一般是采用数据内置或外置的磁带机进行的冷备份,备份磁带同时也存放在本地的网管中心,一旦本地的网管中心出现了灾难,如空袭、战争、火灾、盗窃和地震等灾难时,这些备份磁带也随之俱毁,灾难数据恢复也就失去了前提。弥补冷备份不足的办法是采取异地实时备份,它在灾难发生时可以全面及时的恢复整个系统,但是这种备份策略投资比较大,对于经费一向拮据的档案部门缺乏可行性。
二、云存储及其运用于数字档案信息存储的优势
云存储是在云计算基础上延伸和发展出来的一个新概念,它是通过集群应用、网格技术或分布式文件系统等功能,将网络中大量不同类型的存储设备通过应用软件集合起来协同工作,共同提供数据存储和业务访问功能的一个系统。从根本上说,云存储不是存储,而是服务。人们使用云存储,并不是使用某一个存储设备,而是使用云存储系统带来的一种数据访问服务。总体来说,云存储运用于数字档案信息存储方面主要有以下优势:由成千上万台甚至更多服务器组成的集群具有无限空间,支持无限存储容量和超强扩展能力;用户不再需要购买和升级相关管理软件,只需要根据自己的需要和喜好来租用服务商的价格低廉的云服务,大大降低了数字档案信息存储成本;提供更容易的群组协作,增强各部门的沟通,有利于实现数字档案信息的共享;采用虚拟化技术,其物理设备可能分布在世界上的不同地点,帮助用户更为方便地形成多个异地备份。
三、基于“云”环境的数字档案信息存储方案构想
(一)方案设计的前提条件。主要有以下几个方面:
1.观念前提。档案人员必须认识到那种认为把资源放在自己眼下比放在云中更为安全可靠的想法是不科学的。档案人员一定要转变传统观念,认识到云计算技术和理念给档案信息化建设带来的机遇与挑战,在认真研究数字档案信息存储现状的基础上,结合云存储的优势,探索“云”环境下的数字档案信息存储方案。
2.管理前提。档案部门将云存储技术引入到数字档案信息存储领域必然会导致整个管理体制和管理方式的变革,同时会使整个部门的业务流程发生变化。因此,面临云计算浪潮的冲击,档案部门如何重新调整管理是一个摆在眼前的首要问题。
3.技术前提。云存储本身就是一个多设备、多应用、多服务协同工作的集合体,而将云存储应用到数字档案信息存储中,还要考虑到数字档案信息的特点,因此数字档案信息云存储的实现需要以多种技术发展为前提。这些技术主要包括,影响云存储性能的宽带网络技术,以共享为核心的Web2.0技术,保证存储系统高效运行的应用存储技术、集群技术、网格技术、虚拟化技术和分布式文件系统技术等。 (二)方案设计应该坚持的原则。主要内容如下:
1.在对原有存储系统充分整合的基础上,进行平滑迁移。云存储系统是要整合原有的存储系统,充分利用现有设备,在此基础上构建更大容量、更快响应速度的存储系统。因此,档案部门在准备将数据迁移到云端时,一定要充分利用原有存储系统,并做好扩容准备,满足数字档案信息的长期存储需求。同时,由于原有的存储系统对所处的生态环境已形成一定的依赖性,在向云端迁移时稍不注意就有可能造成数字档案信息的损坏或丢失。因此,系统迁移过程中一定要注意迁移的平滑性,尽可能保持数据的所处环境的安全稳定。
2.最大限度地保障数字档案信息的安全长期保存。数字档案信息的安全长期保存是存储方案设计的核心,也是难点。“云”环境下的数字档案信息存储方案的设计一定要从各方面最大限度地保障数字档案信息的安全长期保存。
3.保障数字档案信息的共享性,满足档案部门的各种存储需求。利用云存储的共享优势,解决数据存储的多样性和零散性,将地理位置分散的数字档案信息进行整合,形成具有统一逻辑视图的高性能数字档案信息云存储系统。同时,由于各地区档案部门在数字档案资源建设发展程度上有很大的差别,对数字档案信息资源的存储需求有很大不同,而且云存储中的存储设备多种多样,各种设备的性能根据资源的特点而有所差异。所以,在设计云存储方案时就要考虑到不同档案部门的差异化需求。
(三)数字档案信息的存储体系架构设想。笔者认为,参照云存储的体系架构,可以将“云”环境下的数字档案信息存储体系分为四层,分别为:存储层、基础管理层、应用接口层和用户访问层。
1.存储层。存储层是“云”环境下的数字档案信息存储架构的底层,也是存储的硬件层面。它为整个存储系统提供基本的网络环境、物理存储资源和逻辑存储资源。它通过网络把数量庞大且地理上分散的各种物理设备组合起来,用虚拟化技术屏蔽掉底层的硬件差异,使得档案部门以资源池的方式对外提供服务,并通过统一的管理逻辑和接口,进行存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护,确保硬件设施的安全与及时更新。
2.基础管理层。基础管理层是集群系统、分布式文件系统和网络分布技术的集成,它是“云”环境下的数字档案信息存储体系架构的核心层。通过集群、分布式文件系统、网格计算等技术,档案部门可以实现云存储中的多个存储设备间的协同工作,包括存储监控、调度,副本管理等,并根据档案部门的需求通过分布式文件系统在任何地点任何时刻向档案用户提供同一种数字档案信息服务,并保障了更强更好的数据访问性能,保证众多档案用户可以同时访问使用数字档案信息资源。
3.应用接口层。应用接口层是指利用云基础设施为用户提供各种应用软件部署和运行环境,并使根据用户需求开发出来的应用程序可以运行在这个环境之内,并且其生命周期被该环境所控制,而并非只是简单地调用平台提供的接口。应用层为档案用户提供了数字档案信息存储平台和各种个性化的Web服务,并用灵活简易的方式实现数字档案信息资源的聚合共享,同时可以对数字档案信息的安全备份和系统容灾进行全程监控。
4.访问层。经过授权,任何一个用户可以通过互联网终端设备随时随地地登录“云”环境下的数字档案信息存储系统,并对各种数字档案信息服务实行“一站式”浏览与体验,从而满足自己对数字档案信息的个性化需求。为了保障数字档案信息免遭非法用户的访问,云计算采用用户访问控制、身份认证、用户行为监测与审计等技术手段,对数字档案信息的安全性进行全方位的监控,以保障合法用户获取安全数字檔案信息的权利。
【参考文献】
[1]郎斌.档案数字化建设中信息资源存储系统的选择[J].兰台内外,2007(2):60~62.
[2]百度百科.SAN[2011-12-08].http://baike.baidu.com/view/120921.htm.
[3]张健.电子文件双套制存在的风险[J].北京档案,2009(3):25~26.
[4]李勇.云计算对信息服务的影响及存在的问题[J].情报理论与实践,2009(12):90~92.