论文部分内容阅读
[摘 要]在大数据时代,做好图书馆文献资源建设工作一定要结合时代的需求和先进的技术。本文论述了图书馆文献资源建设的新要求和新目标,以及建设的模式和方案,供参考和借鉴。
[关键词]大数据;图书馆;文献资源;建设
中图分类号:C289 文献标识码:A 文章编号:1009-914X(2017)25-0318-01
1、大数据的技术特点
目前大数据的概念没有标准定义,一般认为它是一种数据量很大,数据形式多样化的非结构化数据。维基百科定义为:大数据是指无法在一定时间内用常规工具对其内容进行抓取、管理和处理的数据集合。
2、大数据环境下高校文献采访工作变革
在大数据时代,文献资源建设的新要求和新目标是非常明确的,那就是要调动行业的积极性、主动性和创造性,加强科学管理,就是围绕着读者群体的文献需求进行改进和发展。
2.1 思维变革
大数据既是一种技术,更是一种思维,一种理念。采访工作人员增强大数据意识,意识到数据就是图书馆的“生命”。培养大数据思维,加强全面收集数据,特别是半结构化和非结构化数据的收集。充分利用全体数据,从看似杂乱无章的海量数据中找出背后逻辑,发现一般性规律到小概率事件。改变利用因果关系在少量数据基础上进行推理的习惯,充分认识到大数据是由一个个数据、数据库、数据群不断累加而成,数据越大其价值才越大。因此,我们在挖掘、分析大数据时,就更关注数据库内部、数据群之间的关联,通过关联物来捕捉现在,预测未来,以便挖掘出更多的隐性价值。改变在数据使用过程中内容的局限和狭隘,充分认识到数据的混杂性,允许有不精确性的存在。充分认识到大数据的开放性,改变传统的带有预设的“已知的未知”科学研究方法,研究大数据时不再带有预设,而是“未知的未知”,从而发现未有的价值。
2.2 工作方式变革
在大数据时代,采访工作人员变革传统的工作方式。在信息采集整合方面,不再局限于三目及供应商提供的采访数据,更要注重采集半结构化和非结构化数据,如图片、视频、音频等,力求信息的全面,并采用DEEPWEB技术进行高质量数据集成、抽取和整合。在信息存储方面,改变传统的关系型数据库方式,采用颁布式数据存储技术(如GFS技术)并列存储信息数据。GFS技术是由谷歌公司提出并在IBM、百度等公司得广泛应用和快速发展。并列存储结构能够快速加载海量数据,缩短查询时间,高效利用磁盘空间等。在信息处理方面,摒弃传统计算机处理技术,利用大数据技术处理信息。利用大数据挖掘技术、分类分析技术、聚类分析技术,挖掘信息数据潜在价值,发现数据间数据关系及历史数据演化规律。利用数据可视化技术描述、反映数据规律,以便人们对数据分析结果的理解和流通。利用数据高效索引技术(如谷歌公司提出的BIGTABLE技术)查询数据。
2.3 工作管理变革
文献采访工作是一项涉及方方面面的系统工程,构建科学合理的文献采访工作管理体系,使文献采访工作有章可循,有法可依,保障文献采访工作质量。在大数据环境下,构建一个统一、透明的以大数据为平台,以大数据技术为依托,众多信息源实时动态集成的管理系统。通过这个平台,采访工作人员可以实时动态地了解馆藏情况,用户信息需求、不同层次用户阅读特点及规律,了解图书市场出版情况,掌握核心出版社图书出版动态,了解供应商实际综合情况等。进行图书采选时利用大数据分析技术,建立图书评价工具模型,根据图书评价体系,各种因子的影响权重,精准地挑選出符合本馆的图书。利用信息资源采访数据集成管理系统采选图书,更具客观性,避免掺杂太多采访工作人员个人主观色彩。有利于提高图书借阅率,提高馆藏质量及提高文献资源购置费的有效利用。
3、大数据环境下高校编目工作的变化
随着移动互联网、云计算、大数据等技术的发展,图书馆的编目工作也发生了巨大变化,经历了手工编目、在版编目(CIP)、机读目录到联机联合编目等过程,编目工作手段的不断更新给图书馆和读者带来了明显的效益。在大数据环境下,人们查阅资料的方式不再局限于图书馆,越来越多的人从网络和各种数据库中获取所需的信息。读者对数据资源的需求日益增多,要求编目产品不仅能提供传统的信息资源的书目检索功能,还要满足资源导航、知识组织、对象数据管理等多方面的需求。读者检索信息资源方式的改变,给图书馆编目工作带来新的冲击与挑战。
3.1 编目环境及载体的变化
在大数据技术高速发展的今天,作为图书馆基础工作的编目工作也随之发生了变化。传统的图书编目环境是以印刷技术媒介为主的纸质出版物,而现代数字图书馆面对着高速发展的网络技术环境,以数字化信息、虚拟介质为载体,在不必拥有实体资源的环境下提供相应的服务,大数据技术的应用揭示了传统编目方式难以展现的关联关系,文献信息的载体的多元化使各类非传统类型文献不断涌现,如缩微资料、录音资料、影像资料、媒体资源等,图书馆的馆藏模式已不再是传统印刷型文献的一统天下。因此,在大数据环境下,编目员的工作也从对纸质文献资源的机读数据的录入等基本内容延伸,不再只是在封闭的环境中对馆藏文献信息进行编目、加工,而是在动态的、数字化环境中对复杂的信息进行揭示、规范和有效整合。图书馆的作用也在整个社会中逐步变成信息提供,而不仅仅是文献收藏,在组织与揭示馆藏方面有了更广阔的发挥空间,同时也面临着新的挑战和更高的要求。
3.2 编目工作模式的变化
在传统的编目工作中,图书馆编目员是书目数据的唯一生产者,文献编目工作一般是各图书馆根据一定的标准和规范,对各自的馆藏文献进行著录、标引及目录组织,编目工作处于相对独立、手工操作状态,所产生的书目数据往往只供本馆的读者使用。1994年,受OCLC(Online Computer Library Center,联机计算机图书馆中心)的启示,上海地区信息资源协作网成立,该协作网在计算机网络、数据库建设、网上资源共享方面进行了有益探索。1997年,“中国图书馆联合编目中心”成立,迄今该中心书目数据的使用单位已超过2000家,其成员馆现已发展到1000多家。除此之外,中国高等教育文献保障系统(CALIS)联机合作编目中心、中国社会科学院联合编目中心、地方版文献联机采编协作网等也相继建立,另外,还有一些书商也建立了自己的书目中心。不同机构、不同区域、不同文献形式的多种联机编目形式,为图书馆奠定了联机编目的基础,通过终端及网络,各成员馆与联机编目中心进行实时检索,及时获取数据库中的书目数据,再通过拷贝的方式套录所需编目数据,实施联机联合编目,共建联合目录数据库,共享书目数据资源,最大限度地节省了人力、物力、财力,减少了编目工作的重复进行,把高质量的书目数据提供给读者,更好地发挥了图书馆书目数据资源的效益。联机编目是图书馆编目工作目前的最佳模式,它不仅改变了图书馆传统的编目工作模式,在利用先进的数字化存储技术,压缩存储空间、改进信息组织模式、提高检索速度的基础上,使编目工作愈加社会化、网络化、标准化和规范化,并使资源共享能够真正得以实现。
4、结束语
综上所述,只有真正提升了图书馆文献资源建设的水平,才能够让图书馆文献资源建设的效果更好,更好的收集各類资源,充实图书馆文献,发挥出图书馆的文化效益。
参考文献
[1] 张瑜.大数据环境下图书馆文献资源库建设与利用研究[D].辽宁师范大学,2014.26.
[2] 陈巧玲.智慧时代国内高校图书馆服务创新研究[D].福建师范大学,2014.14.
[关键词]大数据;图书馆;文献资源;建设
中图分类号:C289 文献标识码:A 文章编号:1009-914X(2017)25-0318-01
1、大数据的技术特点
目前大数据的概念没有标准定义,一般认为它是一种数据量很大,数据形式多样化的非结构化数据。维基百科定义为:大数据是指无法在一定时间内用常规工具对其内容进行抓取、管理和处理的数据集合。
2、大数据环境下高校文献采访工作变革
在大数据时代,文献资源建设的新要求和新目标是非常明确的,那就是要调动行业的积极性、主动性和创造性,加强科学管理,就是围绕着读者群体的文献需求进行改进和发展。
2.1 思维变革
大数据既是一种技术,更是一种思维,一种理念。采访工作人员增强大数据意识,意识到数据就是图书馆的“生命”。培养大数据思维,加强全面收集数据,特别是半结构化和非结构化数据的收集。充分利用全体数据,从看似杂乱无章的海量数据中找出背后逻辑,发现一般性规律到小概率事件。改变利用因果关系在少量数据基础上进行推理的习惯,充分认识到大数据是由一个个数据、数据库、数据群不断累加而成,数据越大其价值才越大。因此,我们在挖掘、分析大数据时,就更关注数据库内部、数据群之间的关联,通过关联物来捕捉现在,预测未来,以便挖掘出更多的隐性价值。改变在数据使用过程中内容的局限和狭隘,充分认识到数据的混杂性,允许有不精确性的存在。充分认识到大数据的开放性,改变传统的带有预设的“已知的未知”科学研究方法,研究大数据时不再带有预设,而是“未知的未知”,从而发现未有的价值。
2.2 工作方式变革
在大数据时代,采访工作人员变革传统的工作方式。在信息采集整合方面,不再局限于三目及供应商提供的采访数据,更要注重采集半结构化和非结构化数据,如图片、视频、音频等,力求信息的全面,并采用DEEPWEB技术进行高质量数据集成、抽取和整合。在信息存储方面,改变传统的关系型数据库方式,采用颁布式数据存储技术(如GFS技术)并列存储信息数据。GFS技术是由谷歌公司提出并在IBM、百度等公司得广泛应用和快速发展。并列存储结构能够快速加载海量数据,缩短查询时间,高效利用磁盘空间等。在信息处理方面,摒弃传统计算机处理技术,利用大数据技术处理信息。利用大数据挖掘技术、分类分析技术、聚类分析技术,挖掘信息数据潜在价值,发现数据间数据关系及历史数据演化规律。利用数据可视化技术描述、反映数据规律,以便人们对数据分析结果的理解和流通。利用数据高效索引技术(如谷歌公司提出的BIGTABLE技术)查询数据。
2.3 工作管理变革
文献采访工作是一项涉及方方面面的系统工程,构建科学合理的文献采访工作管理体系,使文献采访工作有章可循,有法可依,保障文献采访工作质量。在大数据环境下,构建一个统一、透明的以大数据为平台,以大数据技术为依托,众多信息源实时动态集成的管理系统。通过这个平台,采访工作人员可以实时动态地了解馆藏情况,用户信息需求、不同层次用户阅读特点及规律,了解图书市场出版情况,掌握核心出版社图书出版动态,了解供应商实际综合情况等。进行图书采选时利用大数据分析技术,建立图书评价工具模型,根据图书评价体系,各种因子的影响权重,精准地挑選出符合本馆的图书。利用信息资源采访数据集成管理系统采选图书,更具客观性,避免掺杂太多采访工作人员个人主观色彩。有利于提高图书借阅率,提高馆藏质量及提高文献资源购置费的有效利用。
3、大数据环境下高校编目工作的变化
随着移动互联网、云计算、大数据等技术的发展,图书馆的编目工作也发生了巨大变化,经历了手工编目、在版编目(CIP)、机读目录到联机联合编目等过程,编目工作手段的不断更新给图书馆和读者带来了明显的效益。在大数据环境下,人们查阅资料的方式不再局限于图书馆,越来越多的人从网络和各种数据库中获取所需的信息。读者对数据资源的需求日益增多,要求编目产品不仅能提供传统的信息资源的书目检索功能,还要满足资源导航、知识组织、对象数据管理等多方面的需求。读者检索信息资源方式的改变,给图书馆编目工作带来新的冲击与挑战。
3.1 编目环境及载体的变化
在大数据技术高速发展的今天,作为图书馆基础工作的编目工作也随之发生了变化。传统的图书编目环境是以印刷技术媒介为主的纸质出版物,而现代数字图书馆面对着高速发展的网络技术环境,以数字化信息、虚拟介质为载体,在不必拥有实体资源的环境下提供相应的服务,大数据技术的应用揭示了传统编目方式难以展现的关联关系,文献信息的载体的多元化使各类非传统类型文献不断涌现,如缩微资料、录音资料、影像资料、媒体资源等,图书馆的馆藏模式已不再是传统印刷型文献的一统天下。因此,在大数据环境下,编目员的工作也从对纸质文献资源的机读数据的录入等基本内容延伸,不再只是在封闭的环境中对馆藏文献信息进行编目、加工,而是在动态的、数字化环境中对复杂的信息进行揭示、规范和有效整合。图书馆的作用也在整个社会中逐步变成信息提供,而不仅仅是文献收藏,在组织与揭示馆藏方面有了更广阔的发挥空间,同时也面临着新的挑战和更高的要求。
3.2 编目工作模式的变化
在传统的编目工作中,图书馆编目员是书目数据的唯一生产者,文献编目工作一般是各图书馆根据一定的标准和规范,对各自的馆藏文献进行著录、标引及目录组织,编目工作处于相对独立、手工操作状态,所产生的书目数据往往只供本馆的读者使用。1994年,受OCLC(Online Computer Library Center,联机计算机图书馆中心)的启示,上海地区信息资源协作网成立,该协作网在计算机网络、数据库建设、网上资源共享方面进行了有益探索。1997年,“中国图书馆联合编目中心”成立,迄今该中心书目数据的使用单位已超过2000家,其成员馆现已发展到1000多家。除此之外,中国高等教育文献保障系统(CALIS)联机合作编目中心、中国社会科学院联合编目中心、地方版文献联机采编协作网等也相继建立,另外,还有一些书商也建立了自己的书目中心。不同机构、不同区域、不同文献形式的多种联机编目形式,为图书馆奠定了联机编目的基础,通过终端及网络,各成员馆与联机编目中心进行实时检索,及时获取数据库中的书目数据,再通过拷贝的方式套录所需编目数据,实施联机联合编目,共建联合目录数据库,共享书目数据资源,最大限度地节省了人力、物力、财力,减少了编目工作的重复进行,把高质量的书目数据提供给读者,更好地发挥了图书馆书目数据资源的效益。联机编目是图书馆编目工作目前的最佳模式,它不仅改变了图书馆传统的编目工作模式,在利用先进的数字化存储技术,压缩存储空间、改进信息组织模式、提高检索速度的基础上,使编目工作愈加社会化、网络化、标准化和规范化,并使资源共享能够真正得以实现。
4、结束语
综上所述,只有真正提升了图书馆文献资源建设的水平,才能够让图书馆文献资源建设的效果更好,更好的收集各類资源,充实图书馆文献,发挥出图书馆的文化效益。
参考文献
[1] 张瑜.大数据环境下图书馆文献资源库建设与利用研究[D].辽宁师范大学,2014.26.
[2] 陈巧玲.智慧时代国内高校图书馆服务创新研究[D].福建师范大学,2014.14.