漫谈数字遗产的保护

来源 :中国信息导报 | 被引量 : 0次 | 上传用户:ldrjordan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  现代社会中越来越多的信息是以数字化的形式存在和保存的。解决好数字化信息的长期保存问题是具有重要意义的,它涉及各个国家的不同行业和部门。这些信息若保存得不好,就会永久丢失,因此我们要像保护自然遗产和文化遗产一样重视保护数字遗产。联合国教科文组织(UNESCO)一直关注数字遗产保护的问题。2002年11月,UNESCO在广泛征求各国对数字化产品保护的意见后,制订了《数字遗产保护草案》,呼吁成员国及早重视这个问题。
  
  一、数字遗产的概念
  
  根据UNESCO的定义,数字遗产包括从现存的任一种形式的知识转化成的数字产品或只以数字形式存在的产品,包括线性文本、数据库、静态或动态图像、相关的在线或离线软件等,涉及从病历到DVD影碟,从卫星监视数据到网站呈现的多媒体,从超市收银机里的消费数据到人类基因组的科研数据文件,从新闻组的档案到图书馆的目录等。
  
  二、数字遗产保护的意义
  
  数字化产品的快速增长使目前任何一种保存方法都无法满足。平台、程序和计算机等设备不断更新导致数据无法读取的时间从以年代计算缩短到以年计算。因此,在数字化材料产生初期就要考虑维持其整个生命周期中的可读性。文化遗产的保护是由法律框架和程序支持的。虽然各国的出版法规和档案法条款不同,但是基本原则大致相同,出版物一般由国家图书馆负责收集和保存。数字化产品的特点是形式和内容繁多、地域广阔、内容更新快,并且许多互联网站是个人和非正式团体拥有。已有的出版法规的基本原则是按出版地进行管理,这种法规不适用于互联网,因为域名不能直接反映内容的出版地和语种,更何况许多网站是镜像。因此,按照现有的出版法规不能确定哪些内容应该被定为出版物、哪些数字化产品值得长期保存、应由谁最先负责收集和保存信息以及采取何种方式保存这些信息。
  当然不能仅靠时间来回答这些问题。一般而言,互联网上信息的生命周期从44天至2年不等,随着网站的不断更新,无数的材料消逝后什么痕迹都未留下。当机构或公司失去兴趣或财力不济时,整个网站都会消逝。这种现象不仅存在于小网站,甚至存在于中央和政府网站。一些遗产机构已经认识到互联网的不稳定性,希望采取一个前瞻性的方案以保证互联网信息多样性,但是它们的工作由于缺乏互联网信息保存的标准而受阻。因此,要调整现有的出版法规,将数字化产品纳入国家的收藏范围,确保所有对后世有价值的网页内容都真正受到保护。
  
  三、数字遗产保护的困难
  
  数字遗产保护的困难包括收集网站信息的困难和数据保存的困难。收集网站信息的困难一方面是由于网站之间的链接和交互式导航经常会断开,导致信息丢失;另一方面是由于数据库产生的动态信息隐藏在许多网站的静态页面之下,复制网页不能捕获数据库包含的数倍于表面信息的“深层网页”信息。
  数据保存的困难还在于是能否使所保持的内容和功能再现。一般来讲,有三种原因造成数字产品不可读。一是存储介质降级:磁带和磁盘的物理生命周期比缩微片和无酸纸要短,存储介质失效造成数据损失。二是相应软件失效:程序的替代版本即使是兼容的,也总是有时间限度的,这将导致文件信息丢失。三是计算机的新系统和外围配置不支持老产品,不可能为了使原有文件可读而长期保留老计算机和外围设备。
  
  四、数字遗产保护的方法
  
  1.各国的数字遗产保护现状
  尽管存在许多不确定性,但由许多保存机构在法律、结构、经济和技术框架上进行的数字遗产保护的尝试和努力是非常有价值的。
  有些国家在制定离线数据产品如CD-ROM等的保存法规之外,也将在线电子期刊作为国家图书馆长期保存的传统出版期刊的一种延伸形式。至于如何确保科技电子期刊环境稳定,包括动态链接、数据和多媒体播放,目前还缺乏明确的法律规定,只能是出版者自愿合作。
  一些国家的图书馆已经制定了策略,根据出版物的概念来收集和保存网站内容。如澳大利亚图书馆的“潘朵拉”计划就是一个很好的实例。该计划将出版物定义放宽,认为互联网上任何信息都是出版物,选择收藏的内容是与澳大利亚相关的,或是澳大利亚人制作的;选择标准则是“优先考虑有长期研究价值的权威出版物”。又如1997年开始的芬兰EVA(European Visual Archive )项目旨在收集并存档互联网上芬兰域名下的各种形式的电子出版物,并在图书馆中长期保存。1996年开始的瑞典文化遗产工程则是对瑞典域名下的所有网站进行全部收藏。
  一些国家的专门信息机构也开始从互联网中进行定题收藏。如荷兰的社会历史国际研究所作为收集和编档社会历史材料的机构,已于1994年开始收集互联网上关于政策和社会事务的网络文献,已从互联网上的974个新闻组中收集了90万条政策性消息。
  除了选择性收藏之外,也有对互联网内容进行全部收藏的项目。计算机存储成本逐渐在降低,而人工选择的成本则逐渐增加,所以采取全部收藏的方式收集所有域名下的网站有一定前景。收集方法是每年对各个网站进行数十次“快照”式存储,“快照”次数越多,收集内容则越多,成本也就越高。1996年开始的由美国国会图书馆和史密森尼博物馆参加的“互联网档案”计划目前已经收集了全世界100亿个网站的100T的信息,并向公众免费开放,例如输入中国科技信息研究所的域名www.istic.ac.cn,可以找到从1997年至今的50条记录。
  目前,我国尚未开展此类保护工作,各网站信息资源的保护多是由自己解决,如新浪网从建立至今的4年多时间,信息已达几十T,全部由自己存储,读者可以随时查看。
  以上所有的项目至今只有几年的时间,很难确定这些信息在25年甚至50年后的保存情况。
  
  2.收藏技术的选用
  纸质印刷品的长期保存的方法之一是用缩微胶片,相应地,为保存数字产品也必须将它转存到精良的存储介质中。但是与传统印刷品不同,数字化产品的保存除了考虑保存构成文件的字节外,还要保证文件在长时间后可读或可用。
  保护数字遗产首先要界定在未来系统中需要体现的内容和特征。如果优良的功能是首要目标,那么就要根据未来的需要而升级,或将系统设计成可随技术发展而升级。如果保护历史资料的本来面目是目标,那么未来的读者看到的数字文件就是其本来面目。
  材料的归档是采取适当的保存方式的先决条件,也是保存机构的一个极大的负担。初次归档时的工作对日后的保护很重要。归档时需要正确描述字节的特征和目前的软硬件环境,并用附加档案说明数字产品的形成条件、所有者和其它相关信息。为促进保护,应该集中力量制定不同类别的数字产品的归档标准,并开发自动归档程序。
  现在有二种方法用来同时解决软件和硬件失效问题。一种方法是将软件转存到新平台或不同程序中,特别是转存为标准格式。生产者使用标准软件,如XML、TIFF和PDF,可以促进数字产品保护。数字产品制造者开放源代码、公开归档的细节对保障其产品在保存期有效很有帮助。另一种方法是在新环境中创造操作系统的超级版本,使文件在原有格式下可读。但是如此一来,系统会变得越来越复杂。
  
  3.收藏组织和责任
  传统上,信息产品的创造者和保存者的角色都很明确。一般,创造者不负责保存,而保存者不掌管创造。在数字产品时代,这种分工则被打破。在数字产品创造的初期就要考虑保护问题,即“防止有价信息消失的工作涉及数字产品创造者、提供者和所有者的合作”。理想状况是创造者和收藏者在不同时期共同负责保护。由于创造者并不能自觉意识到危险,保存机构可以在生产和保存方面提供指导。
  创造者的选择会影响随后的归档及保存。图书馆在物理上并不拥有它们所提供的电子期刊,只是由出版者提供并维护更新。因此,在一定意义上,出版者承担了图书馆的角色。创造者使用标准及开放格式,适当的描述和归档、固定的在线资源的域名都有利于日后的保存并降低成本。
  由于数字遗产的保护对大多数机构是未知领域,因此在决定涉足这一领域时,要加强合作和交流,避免付出昂贵代价,使我们的后代在未来还可以看到目前的大量数字产品。▲
  (作者单位:中国科学技术信息研究所北京100038)
其他文献
研究表明拼音文字系统的发展性阅读障碍者与以中文为代表的表意文字系统的发展性阅读障碍者在阅读过程中大脑的激活部位存在差异。关于母语阅读障碍儿童对第二语言学习的影响
成长记录袋是一种新兴的质性评价方式,具有质性描述、目的明确、主体参与等特点,在特殊儿童学习评价中有其独特优势,可以作为特殊儿童学习评价的重要形式之一在实践中加以应
本刊讯第六届“中国北京国际科技产业博览会”(原名“中国北京高新技术产业国际周”,2002年改为现名)将于2003年5月23日至27日在北京举办。本届“科博会”由科技部、教育部、信息产业部、中国贸促会、国家知识产权局和北京市政府等主办,北京市贸促会承办。  今年的“科博会”是中国新一届政府产生后的首次国家级大型科技、经贸国际交流活动,也是北京奥运行动规划开始实施后奥运商机的一次全面展示和交流。本届“
党的十六大指出:实现工业化仍然是我国现代化进程中的历史任务。信息化是我国加快实现工业化和现代化的必然选择。坚持以信息化带动工业化,以工业化促进信息化,走出一条科技含量高、经济效益好、资源消耗低、环境污染少、人力资源优势得到充分发挥的新型工业化路子。  根据十六大报告的精神,企业信息化是走新型工业化道路的客观要求也是必然选择。企业信息化是一个动态的过程。不同的企业,企业信息化的目标不一样,实现的方式
十六大报告对新型工业化道路作了明确描述。新型工业化道路就是指科技含量高、经济效益好、资源消耗低、环境污染少、人力资源优势得到充分发挥的工业化道路,其最显著的特征是以信息化带动工业化,以工业化促进信息化。国家计委主任曾培炎在答记者问时说,新型工业化,这个“新”是相对于传统的工业化来讲的,发达国家都是在工业化之后推行信息化的,中国是一个后发展的国家,这些年信息化发展很快,我们完全可以在工业化的过程中推
按照美国生产力与质量研究中心的定义,“企业知识管理是指为了提高企业竞争力而对知识的识别、获取和充分发挥其作用的过程”。美国信息管理学家D.A.Marchard认为,知识管理体现了数据的组织及获取能力、信息处理能力以及人类的创造和创新能力,也是这几种能力共同作用的过程。据此,知识管理可以分为人的管理和信息管理这两个方面。    一、人的饿管理是知识管理的核心    知识可以将它看作“产生有效行动所需
1.信息管理与知识管理的内涵    信息管理就是对信息资源及其相关资源如信息设备、信息设施、信息技术、信息投资和信息人员等进行规划、预算、组织、指挥和控制的过程。信息管理过程始于信息人员对用户的信息需求的分析,以此为起点,经过对信源的分析、对信息的采集与转换、信息组织、信息存储、信息检索、信息开发和信息传递等环节,最终满足用户的信息需求。信息管理的核心是信息资源的开发和利用,而信息资源的开发和利用
自1999年1月我国政府上网工程启动以来,经过几年的发展,政府网站建设已取得了可喜的成绩,但总体上还处在起步发展阶段。与国外成熟的政府网站相比,我国的政府网站建设还存在着很大的差距,其中信息资源建设的问题尤为突出。    一、政府信息资源建设中存在的问题    1.缺乏统一的建设指南,无论中央政府还是地方政府,都没有对政府信息资源建设进行全面规划,政府信息资源建设存在着体制、运行机制上的问题。国家