高校图书馆数字资源网络存储技术研究

来源 :现代情报 | 被引量 : 0次 | 上传用户:dxseu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   [摘 要]随着信息技术的高速发展以及web20理念在图书馆的信息资源共享领域的广泛应用。内容丰富、方便快捷的数字资源越来越受到图书馆和读者的欢迎,成为图书馆馆藏中所不可或缺的重要组成部分。与传统纸质文献相比,数字文献资源在存储和共享方式有着根本性的不同。本文从高校图书馆的实际需求出发,对当前高校图书馆所采用的几种主流网络存储技术DAS、NAS、SAN、ISCSI等进行了分析和研究。
  [关键词]图书馆信息化;网络存储技术;DAS;NAS;SAN;ISCSI
  [中图分类号]G2507 [文献标识码]A [文章编号]1008-0821(2010)05-0144-04
  Research on Network Storage Technology of
  Digital Resources of University LibraryLi Hao1 Zhang Linlong2
  (1.Department of Information Technology,Shanghai Polytechnic College of Urban Management,
  Shanghai 200438,China;
  2.Library,Shanghai University of Political Science and Laws,Shanghai 201701,China)
  
  [Abstract]Along with the rapid development of information technology and the widespread application of web20 in the information resources sharing fields,the digital resources with rich content and convenient operation are more and more popular in library readers, and have become the important composition in library collection.Compared with the traditional paper literature,the digital resources have the fundamental difference in the storage and sharing way.This article embarked from the actual demand of university library, made an analysis on DAS,NAS,SAN,ISCSI and so on.
  [Keywords]library informationization;network storage technology;DAS;NAS;SAN;ISCSI
  
  在信息技术高度发达的今天,以电子出版物、多媒体资料、文献数据库等为代表的数字资源建设高速发展。随着web20理念在图书馆信息资源共享领域的广泛应用,以网络为主要传播媒介的数字资源凭借着互联网的强大功能,充分展现出其检索便捷,共享快速,内容丰富等优异特性,受到了广大读者的欢迎。图书馆往往也购置海量的数字资源作为馆内纸质文献的重要补充。很多高校的图书馆都拥有数十甚至上百的文献数据库以及百万等级的电子书。在图书馆的整个馆藏体系中,数字资源占据了越来越重要的地位。众所周知,以计算机硬件为载体的数字资源在数据的存储和共享方式上与纸质文献相比有着根本性的不同。而高校图书馆凭借着相对完善的网络基础设施和较强的技术力量,在数字资源的应用方面往往处于业内领先的地位。本文从高校图书馆的实际情况出发,对当前高校图书馆的几种主流网络存储技术进行了研究。
  1 图书馆加强数字资源建设的必要性
  纸质文献以纸张为载体,因此不可避免的存在检索不便,共享困难,不易于长期保存等问题。与之相比,数字资源的优势则是显而易见的。同时随着科技的发展,数字资源变得愈加平民化,我们的阅读习惯和思维方式也因为数字资源的大规模应用在潜移默化中发生了改变。举个简单的例子:在10多年前,当一位读者希望查阅某一领域的相关技术资料,他的第一选择(可能也是惟一的选择)便是图书馆,读者会花费大量的时间在图书馆的书库里查看各类文献,可能还会向熟悉业务的图书馆工作人员寻求帮助来找到所需的资料。但在图书馆向数字化高速发展的今天,读者在寻找所需文献时首先想到的往往是借助计算机和网络来解决问题。读者只需在电脑桌前点击鼠标,便可通过图书馆的OPAC(Online Public Access Catalogue)或某个搜索引擎便捷地找到所需的资讯。甚至还能通过网络直接下载所需的数字资源。当现有的资料无法满足读者需求时,读者所要做的仅仅只是通过网页浏览器连接到另一个数字资源数据库重新进行搜索而已。在阮冈纳赞的“图书馆五定律”中提到,读者的时间被大大的节约了,图书馆的服务水平因此也得到了极大的提升。但同时应该看到,在读者进行愉快的数字图书馆阅览体验的背后,涉及到计算机软硬件、网络、数据库、程序设计等众多的信息技术。在这些技术中,网络存储技术(Network Storage Technologies)无疑是极为重要的一项。毕竟图书馆作为信息的集散地,无论是通过自动化管理系统来提高纸质文献检索流通效率,又或者是向读者提供数字资源,全都离不开存储技术的支持。存储技术的有力支持是图书馆建成为高水准的文献信息中心的基础。
  2 图书馆存储技术的发展和现状
  存储技术被应用于图书馆领域已经有相当长的历史了。在上世纪80年代中期之前,磁盘驱动器甚至还不是电脑的标准配置的年代,图书馆工作人员便开始使用以KB为单位的软盘驱动器来实现数据的存储。而现在,普通电脑的硬盘容量动辄便达到数百GB甚至TB、PB。短短几十年间,前后相差达到了数万倍。除了存储空间的提高,数据存储技术在系统结构和应用模式上也发生了很大的变化。80年代末美国加州大学伯克利分校提出了RAID(Redundant Array of Independent Disk)这一理念,使得存储空间和容量摆脱了物理磁盘的限制,极大的提升了存储的传输速率和安全性。而90年代中期出现的SAN、NAS等网络存储技术更是凭借着强大的性能、灵活的扩展性等优点取得了巨大的成功。目前,中小规模的图书馆往往会采用DAS作为主要的数据存储方式。而有一定资金和技术条件的高校图书馆,则往往都会尝试使用NAS,FC SAN,IP SAN等解决方案来解决图书馆快速增长的数据所带来的压力,为种类繁杂的各式数字资源的正常使用提供保障。
  2010年5月第30卷第5期高校图书馆数字资源网络存储技术研究May,2010Vol30 No53 图书馆数字资源存储所面临的问题
  31 数字资源数量迅猛增加所带来的压力
  数字资源的众多的优点使其受到图书馆和读者的欢迎,但随着图书馆数字化建设的发展,也产生了各种各样的问题。首当其冲的便是数字资源数量高速增加后带来的存储空间压力。同时,数据资源的丰富也导致了读者需求量的直线上升。当前不少高校图书馆都采用24*7的全天候开放模式,同时服务的对象也不再仅限于本校师生。工作时间延长、用户数量的增加及业务范围的扩展对数据存储技术的稳定性、安全性和扩展性来说是一个极大的挑战。
  32 数字资源种类的多样性所带来的存储问题
  数字资源种类增多所带来的系统兼容、数据安全等问题是摆在图书馆工作人员面前另一个严峻的问题。数字资源类型多种多样,既有像ORACLE、DB2、SQL server这样的大型数据库,又有视音频、图片、光盘等电子资源。这些不同类型的数据有着不同的访问特性,运行在Windows、Linux、Solaris等各类操作系统上,对软硬件都有各自不同的要求。因为应用复杂,所以图书馆的各项信息系统一般都采用“分散式”的管理方式。图书馆中的各个部门根据本部门业务的不同,使用独立的服务器、管理系统和数据库。过去图书馆往往认为这样的解决方案逻辑清晰,便于馆内各部门掌控自身业务。以此达到了便于管理和节约成本的目的。但随着图书馆数字化建设的深入,这一方案的弊端不断显露出来。传统的分散式体系随图书馆数字应用的增多变得效率低下和成本高昂。在数据存储方面主要体现在以下几个方面:
  首先是数据资源的复杂性所带来的问题。图书馆是一个结构复杂的系统,汇聚着海量的数字资源。数据的资源来源复杂,种类繁多。但数据的提供者之间却并没有什么统一的标准。各类信息系统开发环境各异,依托于不同的操作系统,使用各式不同的数据库,甚至连数据格式都没有统一的标准。彼此之间也难以进行整合。这种相对分散的数据存储体系,对图书馆的软硬件资源造成了极大的压力。随着图书馆信息化建设的继续,会有越来越多的新系统被引进。若按照传统的集中式管理模式,则需不断添置服务器来满足需要。成本进一步提高。并且在实际工作中,也使得系统的扩容变得极为困难。成为图书馆信息化建设持续发展的障碍。
  另外,在图书馆的信息化建设工程中,经费问题一直出现并困扰着图书馆。而存储可以是IT服务中成本最高的部分。以前很多图书馆往往陷入一个误区,认为数据存储的最大投入是购买存储硬件设备。因此也就没能充分考虑到分散式管理系统所带来的管理成本问题。但事实上,日常管理的费用才是图书馆数据存储最大的支出项目。而且这笔支出将贯穿存储系统的整个生命周期。这让资金有限的高校图书馆难以承受。在网络存储技术和相关的虚拟存储技术出现之前这一问题表现的尤为突出。
  4 常用网络存储技术分析
  数据存储技术一向给人以稳健的印象,但实际上该领域技术的革新从来没有停滞过,相关的技术种类繁多。目前常用的网络存储技术有DAS、NAS和SAN。对于高校图书馆来说,选择的存储方案应有较好的性价比,同时要有一定的可靠性和扩展性来满足图书馆日常业务和未来发展的需要。
  41 DAS(直接附加存储)
  DAS是Direct Attached Storage的缩写,也可称为Server-Attached Storage(服务器附加存储)。指存储设备通过电缆(一般是SCSI接口)直接与服务器相连接。存储设备作为服务器的附加硬件而存在。DAS本身没有任何的操作系统,它直接接收所连服务器的I/O请求,完全依托服务器,通过服务器上的网卡向用户提供数据。它是典型的分散式存储模式。使用DAS的初期投入较低。但磁盘的利用率低且难以扩容,由于无法集中管理,因此在图书馆拥有多台服务器的环境下管理繁琐。另外作为服务器的附件,存储设备占用了服务器上的许多资源,在用户数量较多的情况下这一问题尤其严重,甚至成为整个系统的瓶颈。另外若是图书馆的应用系统较多,则需要相应的购入大量昂贵的服务器,使得成本难以控制。但对信息化程度较低且资金不足的中小规模图书馆来说,DAS不失为一个切实可行的存储解决方案。
  42 NAS(网络附属存储)
  NAS是Network Attached Storage的缩写。一种连接在网络上的存储设备。通常会使用RJ45口,通过以太网向用户提供服务。采用集中式数据存储模式,将存储设备与服务器彻底分离。NAS其实可以看成是一台数据存储服务器,它有自己的CPU、内存、操作系统、磁盘系统。支持NFC、CIFS等网络传输协议,可以跨平台的将不同系统上的数据存储在一台DNS上,方便了图书馆工作人员的管理工作,也降低了成本。由于和服务器独立,数据的处理和缓存等都能直接在NAS上实现,因此相比DAS,NAS不再受到服务器I/O瓶颈的限制,数据存取的速度要快的多。NAS基于File协议,在网页服务和文件存储方面的表现优异,很适合为图书馆的网站服务器和FTP服务器的提供存储。但在数据库存储方面的表现与DAS相比略有不及,但其可扩展性却是前者所远不能比的,用户可以很轻松的将存储空间扩充到上百TB。对那些希望降低存储成本但又希望数据存储具有高性能和高可靠性,同时有一定系统扩展要求的高校图书馆来说是一个很好的选择。NAS的架构如图1所示:
  图1 NAS结构图43 SAN(存储区域网络)
  SAN从诞生之日起便以系统复杂和价格昂贵闻名业界,但其性能的强大也是毋庸置疑的,足以满足大型图书馆海量数据存储共享的需要。SAN是Storage Area Network的缩写。是一种将存储设备、连接设备和接口集成在一个高速网络中的技术。SAN的本身是一个和外部局域网分离的类似以太网的存储网络,由SAN服务器、交换机、集线器、存储设备等设备组成。由于SAN的网络型构架使它可以将通讯协议和网络硬件相分离。多种不同的协议可以在同一个物理介质上进行传输,同时也让SAN具有了几乎无限的可扩展性。SAN配置灵活且扩容方便,可以使用SCSI、FC、SATA、SAS等多种磁盘阵列来扩展IP SAN的容量,可动态分配空间,存储利用率高。由于SAN本身是一个独立的网络,因此不像NAS那样在传输数据时会占用局域网带宽。另外SAN支持Block协议,是直接对物理硬件地址的块级存储访问。这让SAN在数据库存储的方面表现出色。目前常用的SAN解决方案主要分为FC SAN和IP SAN两大类。SAN的架构图如图2所示。
  图2 SAN结构图
   431 FC SAN
  FC SAN使用光纤通道(Fiber Channel)技术作为存储网络的传输介质。光纤通道是在1994年由ANSI标准化组织制订的用于千兆位数据传输通信解决方案,最初是为网络系统设计的。与传统的SCSI技术相比,光纤通道技术提供更高的数据传输速度,现在SAN设备中光纤通道端口的传输速度现在已经达到了4GB;克服了SCSI连接的线缆限制,实现了更远的传输距离,更多的设备连接支持和更稳定的性能。在IP SAN出现之前,FC SAN几乎就是SAN技术的代名词。
  432 IP SAN
  FC SAN的性能毋庸置疑,但需要的巨额投入则让很多中小型用户望而却步。这也一度让SAN和NAS在存储市场的竞争上处于不利的位置。这个时候IP SAN登场了。IP SAN是类似标准以太网(Ethernet)架构的SAN存储网络,它通过ISCSI技术,利用TCP/IP协议进行通信。这就意味着可以直接利用现有的网络,用千兆以太网交换机代替价格昂贵的FC SAN专用的光纤交换机来实现SAN存储网络,因此IP SAN和FC SAN相比成本优势明显。这点让它受到大量用户的青睐。EMC、DELL和NetApp等业界著名厂商也都涉足ISCSI SAN市场。
  说到IP SAN就不能不提ISCSI技术。正是由于这一技术的出现,才使得以IP技术搭建的存储区域网络应运而生。ISCSI技术是由CISCO和IBM公司提出,是一个供硬件设备使用的可以在IP协议的上层运行的SCSI指令集,这实现了在IP网络上运行SCSI协议,使其能够在诸如高速千兆以太网上进行路由选择。服务器因此可与使用IP网络的储存装置互相交换数据。
  44 高校图书馆领域网络存储技术的比较
  441 DAS与NAS
  DAS有着悠久的历史,是曾经应用最广泛的存储技术,但随着技术的发展,DAS在后起之秀NAS和SAN面前则显得有些落伍。从表1可以看出,NAS的各个性能指标都完胜DAS。在总成本和性能方面都有明显优势。对存储和共享要求较高的高校图书馆来说,NAS显然是更为适合的选择。表1 DAS和NAS对比表
  比较项目DAS存储NAS存储存储数据结构分散式存储分散式/集中式存储连接方式SCSIIP初期投入低低维护成本高低扩展成本高低独立操作系统无有扩展性低高管理维护复杂简单传输距离50米内无限制磁盘利用率低高整体性能高低适用对象中小型图书馆中型图书馆
  442 NAS与SAN
  SAN和NAS则是几乎同时出现的存储技术。因此它们从诞生伊始便不可避免的成为竞争对手并被相互比较。但从本质上讲,SAN与NAS是架构完全不同的存储方案。SAN支持Block协议,NAS则使用File协议。这也决定了SAN专注于存储资源的共享,NAS则在立足于文件数据的共享。笔者以为对NAS和SAN来说,仅仅在技术上的对比是不全面的,还应从性价比和发展趋势上来分析问题。表2是NAS与SAN的一些主要指标。表2 NAS和SAN对比表
  比较项目NAS存储FC SANIP SAN成本低高中扩展性中高高管理维护简单复杂简单共享资源文件数据存储资源存储资源连接方式IP光纤通道IP存取方式FileBlockBlock 续表2
  比较项目NAS存储FC SANIP SAN传输介质双绞线光纤通道双绞线传输距离无限(适合小文件)100公里(无中继)无限(大量数据)电磁影响有无有传输速率百兆/千兆4GB百兆/千兆整体性能中高中适用对象中型图书馆大型图书馆中型图书馆
  从表2可以看到,NAS和IP SAN的整体性与FC SAN相比有一定的差距。但若考虑到性价比,由于FC SAN高昂的成本,复杂的管理和维护,使得它并不适合规模不大的高校图书馆。对资金充裕的高校图书馆来说,FC-SAN是不错的选择。对成本较低的IP SAN和NAS来说,IP SAN在性价比上的表现则相当突出。个人认为基于ISCSI的IP SAN解决方案可能更适合中国绝大部分高校图书馆。何况从发展趋势来看,IP SAN和高端的FC SAN在存储技术并无本质区别,在未来万兆交换技术普及后,FC SAN将没有太多的优势可言。从这个角度看,FC SAN更有可能是千兆与万兆交换技术真空期的过渡产品。长远来看,IP SAN的发展前景无疑更为远大。
  5 结束语
  图书馆的存储系统是一个复杂的系统工程。使用的存储技术也各有特色,本文是结合笔者自身经验的一些心得体会,希望能对高校图书馆的数据存储管理提供帮助。最后要重申的是,高校图书馆在选择具体的存储解决方案时,一定不能脱离馆内的具体应用和客观环境。需慎重规划存储体系并做好扩展预案,以免因为不合适的存储方案阻碍图书馆信息化建设的进行。
  
  参考文献
  [1]王国平.图书馆网络中心各存储技术的应用研究[J].科技咨询,2009(18):255-256.
  [2]高.高校数字图书馆存储方案设计及发展研究[J].现代情报,2008,(2):81-83.
  [3]刘琰.浅谈IP SAN存储技术在高校数据中心的应用研究[J].电脑知识与技术,2008,(5):787-789.
  [4]康健明.虚拟存储技术及其在数字图书馆中的应用[J].科技咨询,2009,(18):255-256.
  [5]张燕萍.校图书馆信息资源整合平台系统分析[J].中国信息导报,2007,(8):44-48.
  [6]时成阁.网络存储系统设计[M].华东师范大学出版社,2007.
  [7]姜宁康.网络存储导论[M].清华大学出版社,2007.
  [8]ClarkTom.存储区域网络设计(实现光纤通道和IP SAN的实用指南)[M].电子工业出版社,2005.
其他文献
我国资源型城市作为工业化进程的主要动力源,为国家的经济建设和社会发展做出了重要贡献,但资源型城市本身存在的问题制约了其发展,因此找出我国资源型城市存在的问题的原因以及
在中国经济发展的大格局中,一个独具特色的“绿色版块”正崛起于黔山秀水之间。
正常妊娠羊水随孕周而有所增减,至妊娠足月时超过2000mL为羊水过多。羊水过多的病因过去认为与胎儿畸形、胎盘血管吻合支增多、孕妇或胎儿的各种疾病等因素有关。笔者临床工作
目的:观察丁苯酞治疗急性进展性脑梗死的临床疗效及安全性。方法:96例急性进展性脑梗死患者随机分为治疗组与对照组各48例,两组基础治疗相同,包括予胞二磷胆碱(0.75g/d)和阿司匹林0.1g
针对黑龙江地区资源消耗过度的问题,从降低资源消耗强度的角度提出了相关产业策略。从传统的IPAT方程出发,分析和推导了资源消耗强度的相关理论,并采用物质流模型分析了资源消耗
本文略述了知识经济时代,对知识管理的认识不断更新,从对知识的管理到对人的管理,上升为以知识的应用价值为目的的管理等不同的阶段。并在此基础土提出了高校图书馆应如何构建知
本文阐述了资源描述与检索RDA(Resource Desellption and Access,RDA)的开发背景和经过,RDA开发目的和特点,内容构成和目标,在此基础上分析展望其应用前景。
高金增效灵是由台湾独资新乡高金化学有限公司生产的一种油剂、水剂农药通用的高金氮酮超能特效农药渗透剂.经试验示范和较大面积的应用验证,该产品具有以下特点.
我是3月30日到任的。刚到一两天就有人向我建议,开个副科以上干部大会,发布“施政纲领”、发表“施政演说”。我没有这样做,也不能这样做,一来大家都在一线工作,我是来贵溪工作
“雪中情、雪中情,雪中我们同行……”看罢《当代贵州》第100期“冰雪中的贵州精神”专号,心中涌动的只有一个词:感动。一幅幅具有强烈视觉冲击力的图片,把新时期贵州精神诠释得