论文部分内容阅读
摘 要:大数据现已影响到各行各业,它的到来对高校图书馆的数字化建设不只是机遇,还有挑战。本文概述了大数据技术和高校图书馆之间存在的内在联系,并分析了大数据背景下高校图书馆的数字化建设问题。
关键词:大数据;高校图书馆;数字化
中图分类号:G250.72 文献标识码:B
当下社会信息技术正在持续迅猛地发展,大数据时代已经到来,其明显表现就是新型的数据不断地涌现出来,数据量正呈现爆炸式增长。
高校图书馆是公共信息体系中的重要组成部分,也在紧随时代的脚步进行数字化改革建设。
大数据对于高校图书馆进行数字化建设来说不只是挑战,更是机遇。二者之间存在两方面的内在联系:首先, 大数据背景下的有关技术能为图书馆数字化建设提供必要的帮助;其次,图书馆的数字化建设可以为大数据的相关研究提供经验和应用的空间。
一、大数据和高校图书馆数字化建设之间的内在联系
到目前为止,作为一项逐渐显现出强大功能的技术,我们还没有对大数据做出一个准确的解释,不过通过对不同概念进行分析,我们得出了一个共识——大数据技术就是从各种不同类型的数据中迅速地检索到自己所需的有价值的信息的能力。
高校图书馆的主要作用是为高校教学以及师生的科研任务提供帮助,其是实现高效信息化的主要载体,在高校的发展进程中起着不可替代的作用。
高校图书馆要想为了使自己保持与信息社会发展同步,就必须开展数字化建设。
二、高校图书馆在大数据背景下数字化建设的建设思路
接下来,笔者将从技术发展、资源建设、服务升级三个方面论述高校图书馆在大数据背景下进行数字化建设的思路。
1.技术发展
(1)当今的数据量已经由TB级升级到了PB级,并还在迅猛增长。有调查显示,2015年世界上最大的数据仓库中存有的数据量已经将近100PB。但它对信息的存储能力还不能满足数据快速增长的要求,因此迫切需要开发一种新型的分布式数据库。
(2)传统意义上的图书馆中的数据均为结构化数据,在实现数字化之后,图书馆还拥有了非结构化数据,比如图片、视频等多媒体数据。非结构化数据的增长速度明显高于结构化数据,截至2012年,非结构化数据已经占到了互联网数据量的76%以上。在这种背景之下,关系数据库已经不能满足时代的需求。
(3)处理数据的快捷性。用户在数字化图书馆中能够得到即时服务,可以随时阅读或者下载信息。
而大数据技术要求的也是数据处理的快捷性,数据处理的时间显著缩短,比如300GB的数据只需1秒钟就可以处理完成。
(4)大数据时代下需要对数据进行精简和挖掘,最近几年数据挖掘、数据仓库等技术的快速发展为高校图书馆的发展提供启示,那就是着重发展对大数据的数据挖掘以及分析。高校图书馆只要能在大数据中发现潜在规律和价值,就能够从根本上提升智能化服务水平。
2.资源建设
高校图书馆在实现数字化之后,不要只把资源建设当作自己的服务基础,还要把它当作建设自身的核心所在。资源建设过程中需要大数据技术的强力支持,进而帮助能丰富数据资源的内容和种类,完善数据资源的结构,重点发展原生资源、领域资源以及特色资源,并积极实现资源的共享。
(1)发展原生资源——高校本身在平时的教学和科研过程中发表的各种类型的、各种用途的文献。原生资源是高校学术水平的集中体现,它集中了学校老师的所有科研成果。原生资源的利用价值高,而建设成本低,因此在高校图书馆数字化建设中具有一定的优势。
(2)建立自己的特色资源——这是高校图书馆保持本身特色的根本所在。在当今的大数据背景下,图书馆无需将所有馆藏数据都进行数字化建设,而应该根据本馆的馆藏优势及特色,重点对特色的学科进行数字化建设,因地制宜,才能做得更好。
(3)建立各图书馆之间的资源共享机制——只有保持合作共享,才能够满足用户日益增长的数据需求,才能够在数据爆炸的时代背景下不被淘汰。因此,各高校图书馆之间要建立互通有无的合作式发展关系。
3.服务升级
数字化图书馆的核心服务价值在于满足客户的以下要求:①用户对高质量数据资源的需求;②用户能够迅速方便地检索到所需信息;③对用户关注的信息要持续跟踪并推送给用户。大数据技术的发展使得数字化图书馆能更好地解决以上三个问题,通过提供智能化服务和个性化服务,推动图书馆服务水平的提升。
三、图书馆数字化建设可行性建议
目前还处于大数据技术的初始阶段,各项理论以及实践技术有待完善。高校图书馆要想在大数据时代做好数字化建设,需要未雨绸缪,做好前期的准备工作。
1.建立数字资源的整合平台
为了满足新时期用户快捷、方便的数据需求,摒弃以往复杂的检索方法以及检索界面给用户带来的诸多不便,高校图书馆首先要建立起一个统一检索的数字资源平台,为读者用户提供一站式的服务,并实现数据查阅的快速、聚类呈现、无重复以及多角度。
北京大学图书馆已经建立了一套“未名学术搜索”系统,这为建立整合平台提供了探索经验。
用户通过使用该系统,能快速地检索到本图书馆馆藏中的所有藏书、论文资源、多媒体资源、电子书资源、期刊等各种数据资源,并向用户提供所检索资源的来源、馆藏中的存放位置等重要信息。
2.加强整合原生的信息资源
不断生成的原生数据是未来生活中大数据的重要来源,所以高校图书馆要加强整合原生资源并建立数据库。
目前的各个数据库之间普遍存在着知识关联度低、内容交叉且重复的问题,因此在建立新的原生数据库时,要做好统一协议,建立一个有利于大数据相互融合、操作性强的标准平台。
3.建立精确、个性化的推荐系统
根据不同用户在图书馆中不同的浏览网站、链接搜索、浏览次数以及停留时间,追踪出用户不同的兴趣以及特征方向,基于此为用户建立一套精确的个性化推荐系统。
这种系统在大数据时代可用于分析用户的行为并预测相应的应对方式,其可以为建设大数据提供客观、准确的参考依据。
高校图书馆是大数据的重要组成部分,也是大数据与人们之间联系的桥梁。
因此,高校图书馆不能只安心做大数据时代的受益者,更应该在数字化建设中积极探索,作为一个参与者主动参与到大数据时代的发展进程当中。
参考文献:
[1]樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012,(11).
[2]王天泥.知识咨询:大数据成为信息科技关注新热点[J].图书与情报,2013,(2).
[3]朱开忠.图书馆转型研究[M].北京:人民邮电出版社,2011.
[4]魏 欣,赵 隽,张 敬,等.高校图书馆数字化建设——浅论数字化特色资源的建设[J].图书馆工作与研究,2005,(4).
[5]董秀真,靳艳华.高校图书馆数字化建设[J].医学信息学杂志,2007,(3).
关键词:大数据;高校图书馆;数字化
中图分类号:G250.72 文献标识码:B
当下社会信息技术正在持续迅猛地发展,大数据时代已经到来,其明显表现就是新型的数据不断地涌现出来,数据量正呈现爆炸式增长。
高校图书馆是公共信息体系中的重要组成部分,也在紧随时代的脚步进行数字化改革建设。
大数据对于高校图书馆进行数字化建设来说不只是挑战,更是机遇。二者之间存在两方面的内在联系:首先, 大数据背景下的有关技术能为图书馆数字化建设提供必要的帮助;其次,图书馆的数字化建设可以为大数据的相关研究提供经验和应用的空间。
一、大数据和高校图书馆数字化建设之间的内在联系
到目前为止,作为一项逐渐显现出强大功能的技术,我们还没有对大数据做出一个准确的解释,不过通过对不同概念进行分析,我们得出了一个共识——大数据技术就是从各种不同类型的数据中迅速地检索到自己所需的有价值的信息的能力。
高校图书馆的主要作用是为高校教学以及师生的科研任务提供帮助,其是实现高效信息化的主要载体,在高校的发展进程中起着不可替代的作用。
高校图书馆要想为了使自己保持与信息社会发展同步,就必须开展数字化建设。
二、高校图书馆在大数据背景下数字化建设的建设思路
接下来,笔者将从技术发展、资源建设、服务升级三个方面论述高校图书馆在大数据背景下进行数字化建设的思路。
1.技术发展
(1)当今的数据量已经由TB级升级到了PB级,并还在迅猛增长。有调查显示,2015年世界上最大的数据仓库中存有的数据量已经将近100PB。但它对信息的存储能力还不能满足数据快速增长的要求,因此迫切需要开发一种新型的分布式数据库。
(2)传统意义上的图书馆中的数据均为结构化数据,在实现数字化之后,图书馆还拥有了非结构化数据,比如图片、视频等多媒体数据。非结构化数据的增长速度明显高于结构化数据,截至2012年,非结构化数据已经占到了互联网数据量的76%以上。在这种背景之下,关系数据库已经不能满足时代的需求。
(3)处理数据的快捷性。用户在数字化图书馆中能够得到即时服务,可以随时阅读或者下载信息。
而大数据技术要求的也是数据处理的快捷性,数据处理的时间显著缩短,比如300GB的数据只需1秒钟就可以处理完成。
(4)大数据时代下需要对数据进行精简和挖掘,最近几年数据挖掘、数据仓库等技术的快速发展为高校图书馆的发展提供启示,那就是着重发展对大数据的数据挖掘以及分析。高校图书馆只要能在大数据中发现潜在规律和价值,就能够从根本上提升智能化服务水平。
2.资源建设
高校图书馆在实现数字化之后,不要只把资源建设当作自己的服务基础,还要把它当作建设自身的核心所在。资源建设过程中需要大数据技术的强力支持,进而帮助能丰富数据资源的内容和种类,完善数据资源的结构,重点发展原生资源、领域资源以及特色资源,并积极实现资源的共享。
(1)发展原生资源——高校本身在平时的教学和科研过程中发表的各种类型的、各种用途的文献。原生资源是高校学术水平的集中体现,它集中了学校老师的所有科研成果。原生资源的利用价值高,而建设成本低,因此在高校图书馆数字化建设中具有一定的优势。
(2)建立自己的特色资源——这是高校图书馆保持本身特色的根本所在。在当今的大数据背景下,图书馆无需将所有馆藏数据都进行数字化建设,而应该根据本馆的馆藏优势及特色,重点对特色的学科进行数字化建设,因地制宜,才能做得更好。
(3)建立各图书馆之间的资源共享机制——只有保持合作共享,才能够满足用户日益增长的数据需求,才能够在数据爆炸的时代背景下不被淘汰。因此,各高校图书馆之间要建立互通有无的合作式发展关系。
3.服务升级
数字化图书馆的核心服务价值在于满足客户的以下要求:①用户对高质量数据资源的需求;②用户能够迅速方便地检索到所需信息;③对用户关注的信息要持续跟踪并推送给用户。大数据技术的发展使得数字化图书馆能更好地解决以上三个问题,通过提供智能化服务和个性化服务,推动图书馆服务水平的提升。
三、图书馆数字化建设可行性建议
目前还处于大数据技术的初始阶段,各项理论以及实践技术有待完善。高校图书馆要想在大数据时代做好数字化建设,需要未雨绸缪,做好前期的准备工作。
1.建立数字资源的整合平台
为了满足新时期用户快捷、方便的数据需求,摒弃以往复杂的检索方法以及检索界面给用户带来的诸多不便,高校图书馆首先要建立起一个统一检索的数字资源平台,为读者用户提供一站式的服务,并实现数据查阅的快速、聚类呈现、无重复以及多角度。
北京大学图书馆已经建立了一套“未名学术搜索”系统,这为建立整合平台提供了探索经验。
用户通过使用该系统,能快速地检索到本图书馆馆藏中的所有藏书、论文资源、多媒体资源、电子书资源、期刊等各种数据资源,并向用户提供所检索资源的来源、馆藏中的存放位置等重要信息。
2.加强整合原生的信息资源
不断生成的原生数据是未来生活中大数据的重要来源,所以高校图书馆要加强整合原生资源并建立数据库。
目前的各个数据库之间普遍存在着知识关联度低、内容交叉且重复的问题,因此在建立新的原生数据库时,要做好统一协议,建立一个有利于大数据相互融合、操作性强的标准平台。
3.建立精确、个性化的推荐系统
根据不同用户在图书馆中不同的浏览网站、链接搜索、浏览次数以及停留时间,追踪出用户不同的兴趣以及特征方向,基于此为用户建立一套精确的个性化推荐系统。
这种系统在大数据时代可用于分析用户的行为并预测相应的应对方式,其可以为建设大数据提供客观、准确的参考依据。
高校图书馆是大数据的重要组成部分,也是大数据与人们之间联系的桥梁。
因此,高校图书馆不能只安心做大数据时代的受益者,更应该在数字化建设中积极探索,作为一个参与者主动参与到大数据时代的发展进程当中。
参考文献:
[1]樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012,(11).
[2]王天泥.知识咨询:大数据成为信息科技关注新热点[J].图书与情报,2013,(2).
[3]朱开忠.图书馆转型研究[M].北京:人民邮电出版社,2011.
[4]魏 欣,赵 隽,张 敬,等.高校图书馆数字化建设——浅论数字化特色资源的建设[J].图书馆工作与研究,2005,(4).
[5]董秀真,靳艳华.高校图书馆数字化建设[J].医学信息学杂志,2007,(3).