论文部分内容阅读
中图分类号:TP393文献标识码:A文章编号:1671-7597(2011)0320141-01
0 引言
随着信息社会的快速发展,越来越多的信息被数据化,伴随着Internet的快速发展,数据呈“爆炸式”方式增长,这使数据存储面临着更大挑战。同时,档案信息不同于一般信息,它记录着企业发展的全部历史过程。企业生产、科研密切相关的档案部门,就是要为提高企业经济效益,提高员工业务水平和技术水平服务。今天,企业要想在市场上有立足点,就得不断地开发新产品,以增强企业竞争能力。所有这一切都要求企业档案部门除了直接为企业生产、科研提供原始数据外,还应利用本身信息存储量大的优势,发挥信息咨询、数据库的作用。根据档案管理的特点,本文将着重讨论几种适合档案管理系统的存储技术。
1 各类存储技术介绍及比较
1.1 直接存储DAS(Direct Access Storage)
DAS将存储设备直接与服务器相连,完全以服务器(主机)为中心作为服务器的组成部分。传统的存储模式总线连接存储(Bus Access Storage,BAS)也叫直接连接存储DAS,是以服务器为中心的存储结构,各种存储设备通过IDE、SCSI等I/O总线经过一个通用的服务器连接在网络上。存储与服务器之间通过传统的I/O总线通信。这是一种以计算机主机为中心,与存储硬件相集合,不带有任何的操作系统的存储结构。
1.2 网络连接存储NAS(Network Attached Storage)
NAS是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。NAS通常在一个LAN上占有自己的节点,无需应用服务器的干预,允许用户在网络上存取数据,在这种配置中,NAS集中管理和处理网络上的所有数据,将负载从应用或企业服务器上卸载下来,有效降低总拥有成本,保护用户投资。NAS本身能够支持多种协议(如NFS、CIFS、FTP、HTTP等),而且能够支持各种操作系统。
1.3 存储区域网络SAN(Storage Area Network)
SAN是一种面向网络的存储结构、以数据存储为中心的局域网。SAN采用可扩展的网络拓扑结构连接服务器和存储设备。将数据的存储和管理集中在相对独立的专用网络中。SAN面向服务器提供数据存储服务,服务器实现存储网和应用网间的连接与隔离。由于网络连接使服务器和存储设备之间具有多路、可选择的数据交换能力。使存储设备从服务器附属中分离出来,独立通过网络与服务器相连,消除了原来存储结构在可扩展性和数据共享方面的局限性。
1.4 内容地址存储CAS(Content Addressed Storage)
CAS是由美国EMC公司2002年4月率先提出的针对固定内容存储需求的先进的网络存储技术。CAS具有面向对象存储特征,基于磁记录技术,它按照所存储数据内容的数字指纹寻址,具有良好的可搜索性、安全性、可靠性和扩展性。EMC同时推出了其CAS产品Centera,并成为CAS存储技术的代表性产品。
EMC公司Centera网络存储系统是世界上第一款针对固定内容的内容寻址存储CAS网络存储解决方案。Centera网络存储系统实现了软硬件的完美结合,非常理想地解决了固定内容存储需求。对于网络存储客户而言,Centera系统的重要价值在于它的软件系统,通过丰富的API,用户可以非常容易地实现对整个网络存储系统的使用和管理。
CAS技术的优点如下:确保内容的可靠性;提供了全局惟一;位置独立的标识符;单一实例存储。
面向固定内容存储的Centera网络存储系统较传统网络存储技术能够更好地适应信息急剧增长的实际需求,具有广阔的发展前景,可以广泛地应用到企业级内容/文档管理、HSM解决方案、PC备份和归档、E-mail服务、医疗成像等诸多领域。
1.5 DAS、NAS、SAN和CAS的对比分析
NAS与DAS相比,NAS通过文件系统的集中化管理能够实现网络文件的访问,用户能够共享文件系统并查看共享的数据。
SAN与NAS的主要比较有如下的几点:
1)SAN技术为每台主机提供了更多的可控存储容量;
2)可提供更高的传输带宽;
3)可提供更长的连接距离;
4)具有数据可用和共享方面的优势;
5)面向网络的集中存储和多路径的数据交换使数据共享变得容易。
CAS与SAN的比较,主要有如下优点:
1)不需要记住文件路径。SAN、NAS在存储文件时是按照地址存放文件的,用户找文件的时候一定要知道它放在哪个磁盘分区的哪个目录里,否则就要搜索。而CAS没有分区、没有目录,用户不需要记住文件路径,只需要把数据交给CAS,CAS给用户一个数字指纹,相当于公民身份证,靠一串数字和字母组合的数字指纹来识别用户存储的数据。
2)免维护性。由于CAS存储数据方式的不同,导致与NAS、SAN最大的不同是CAS的免维护性。在CAS的情况下,一个管理员则能够轻松管理500TB的数据。
3)有利于SAN瘦身。此外,当用户的数据量越来越大的时候,其数据就一定要放在CAS,因为当用户的数据从1TB扩展到50TB的时候,SAN的性能会急剧下降,所以必须把固定内容数据、长期的具有历史保存价值的数据剥离出来,使SAN“瘦身”。
2 网络存储(SAN+CAS)集成在档案系统的应用
档案系统明显是以文件系统应用为主,如视频、PDF、CAD、3D等,同时又有部分数据库应用,在大量的文件应用中,归档的问题非常突出,如果既能实现安全的归档,又能实现归档数据的在线访问,是系统建设的关键点之一。要同时满足系统对数据库类应用的高速访问,文件类应用的读写和满足系统在线归档的要求则要求同时采用SAN、CAS技术,并且要求能够统一集成。
SAN是存储域的网络,是高性能、高可靠的数据访问方式,这是SAN技术特长。采用SAN技术,在数据库业务系统的主机和存储设备之间通过SAN交换机连接起来,构成网络存储,这就保证了数据库业务系统的高性能、高可靠性数据访问需求及未来扩展的灵活性。
在考虑数据整合的过程中,我们清楚的认识到,现有的包括将来的海量数据本身是有很大的区别的,有的数据访问频率高,有的访问频率低,但是在某个不确定的时间必须能够提供出来,如果存放在一起,那么整个系统的访问效率会被降低,并且系统的成本会上升很多,因此,在线归档和访问成为系统的重要需求。
3 总结
目前对于中石油来讲正是规划建设信息基础架构的最佳时期,信息基础架构的本质是网络存储建设,当然在数据中心采用SAN+CAS的理想模式成为评价解决方案完整性的重要指标,EMC公司的解决方案理想的SAN+CAS集成模式,在该点上具有绝对优势。
0 引言
随着信息社会的快速发展,越来越多的信息被数据化,伴随着Internet的快速发展,数据呈“爆炸式”方式增长,这使数据存储面临着更大挑战。同时,档案信息不同于一般信息,它记录着企业发展的全部历史过程。企业生产、科研密切相关的档案部门,就是要为提高企业经济效益,提高员工业务水平和技术水平服务。今天,企业要想在市场上有立足点,就得不断地开发新产品,以增强企业竞争能力。所有这一切都要求企业档案部门除了直接为企业生产、科研提供原始数据外,还应利用本身信息存储量大的优势,发挥信息咨询、数据库的作用。根据档案管理的特点,本文将着重讨论几种适合档案管理系统的存储技术。
1 各类存储技术介绍及比较
1.1 直接存储DAS(Direct Access Storage)
DAS将存储设备直接与服务器相连,完全以服务器(主机)为中心作为服务器的组成部分。传统的存储模式总线连接存储(Bus Access Storage,BAS)也叫直接连接存储DAS,是以服务器为中心的存储结构,各种存储设备通过IDE、SCSI等I/O总线经过一个通用的服务器连接在网络上。存储与服务器之间通过传统的I/O总线通信。这是一种以计算机主机为中心,与存储硬件相集合,不带有任何的操作系统的存储结构。
1.2 网络连接存储NAS(Network Attached Storage)
NAS是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。NAS通常在一个LAN上占有自己的节点,无需应用服务器的干预,允许用户在网络上存取数据,在这种配置中,NAS集中管理和处理网络上的所有数据,将负载从应用或企业服务器上卸载下来,有效降低总拥有成本,保护用户投资。NAS本身能够支持多种协议(如NFS、CIFS、FTP、HTTP等),而且能够支持各种操作系统。
1.3 存储区域网络SAN(Storage Area Network)
SAN是一种面向网络的存储结构、以数据存储为中心的局域网。SAN采用可扩展的网络拓扑结构连接服务器和存储设备。将数据的存储和管理集中在相对独立的专用网络中。SAN面向服务器提供数据存储服务,服务器实现存储网和应用网间的连接与隔离。由于网络连接使服务器和存储设备之间具有多路、可选择的数据交换能力。使存储设备从服务器附属中分离出来,独立通过网络与服务器相连,消除了原来存储结构在可扩展性和数据共享方面的局限性。
1.4 内容地址存储CAS(Content Addressed Storage)
CAS是由美国EMC公司2002年4月率先提出的针对固定内容存储需求的先进的网络存储技术。CAS具有面向对象存储特征,基于磁记录技术,它按照所存储数据内容的数字指纹寻址,具有良好的可搜索性、安全性、可靠性和扩展性。EMC同时推出了其CAS产品Centera,并成为CAS存储技术的代表性产品。
EMC公司Centera网络存储系统是世界上第一款针对固定内容的内容寻址存储CAS网络存储解决方案。Centera网络存储系统实现了软硬件的完美结合,非常理想地解决了固定内容存储需求。对于网络存储客户而言,Centera系统的重要价值在于它的软件系统,通过丰富的API,用户可以非常容易地实现对整个网络存储系统的使用和管理。
CAS技术的优点如下:确保内容的可靠性;提供了全局惟一;位置独立的标识符;单一实例存储。
面向固定内容存储的Centera网络存储系统较传统网络存储技术能够更好地适应信息急剧增长的实际需求,具有广阔的发展前景,可以广泛地应用到企业级内容/文档管理、HSM解决方案、PC备份和归档、E-mail服务、医疗成像等诸多领域。
1.5 DAS、NAS、SAN和CAS的对比分析
NAS与DAS相比,NAS通过文件系统的集中化管理能够实现网络文件的访问,用户能够共享文件系统并查看共享的数据。
SAN与NAS的主要比较有如下的几点:
1)SAN技术为每台主机提供了更多的可控存储容量;
2)可提供更高的传输带宽;
3)可提供更长的连接距离;
4)具有数据可用和共享方面的优势;
5)面向网络的集中存储和多路径的数据交换使数据共享变得容易。
CAS与SAN的比较,主要有如下优点:
1)不需要记住文件路径。SAN、NAS在存储文件时是按照地址存放文件的,用户找文件的时候一定要知道它放在哪个磁盘分区的哪个目录里,否则就要搜索。而CAS没有分区、没有目录,用户不需要记住文件路径,只需要把数据交给CAS,CAS给用户一个数字指纹,相当于公民身份证,靠一串数字和字母组合的数字指纹来识别用户存储的数据。
2)免维护性。由于CAS存储数据方式的不同,导致与NAS、SAN最大的不同是CAS的免维护性。在CAS的情况下,一个管理员则能够轻松管理500TB的数据。
3)有利于SAN瘦身。此外,当用户的数据量越来越大的时候,其数据就一定要放在CAS,因为当用户的数据从1TB扩展到50TB的时候,SAN的性能会急剧下降,所以必须把固定内容数据、长期的具有历史保存价值的数据剥离出来,使SAN“瘦身”。
2 网络存储(SAN+CAS)集成在档案系统的应用
档案系统明显是以文件系统应用为主,如视频、PDF、CAD、3D等,同时又有部分数据库应用,在大量的文件应用中,归档的问题非常突出,如果既能实现安全的归档,又能实现归档数据的在线访问,是系统建设的关键点之一。要同时满足系统对数据库类应用的高速访问,文件类应用的读写和满足系统在线归档的要求则要求同时采用SAN、CAS技术,并且要求能够统一集成。
SAN是存储域的网络,是高性能、高可靠的数据访问方式,这是SAN技术特长。采用SAN技术,在数据库业务系统的主机和存储设备之间通过SAN交换机连接起来,构成网络存储,这就保证了数据库业务系统的高性能、高可靠性数据访问需求及未来扩展的灵活性。
在考虑数据整合的过程中,我们清楚的认识到,现有的包括将来的海量数据本身是有很大的区别的,有的数据访问频率高,有的访问频率低,但是在某个不确定的时间必须能够提供出来,如果存放在一起,那么整个系统的访问效率会被降低,并且系统的成本会上升很多,因此,在线归档和访问成为系统的重要需求。
3 总结
目前对于中石油来讲正是规划建设信息基础架构的最佳时期,信息基础架构的本质是网络存储建设,当然在数据中心采用SAN+CAS的理想模式成为评价解决方案完整性的重要指标,EMC公司的解决方案理想的SAN+CAS集成模式,在该点上具有绝对优势。