论文部分内容阅读
【摘要】:大数据时代,要主动应对大数据对传统图书馆服务的冲击和挑战,重点建设数据资源网络体系,打造公共数据存储和服务中心,深化知识服务及增强图书馆服务的针对性和有效性,努力探索大数据技术和观念的创新及应用,切实促进图书馆服务的发展和创新。
【关键词】:大数据时代;数据挖掘;图书馆服务;知识服务
大数据时代的到来,必将对当前图书馆的发展理念、工作定位、服务模式等产生巨大冲击,图书馆事业亦将面临一个重大的抉择和发展起点。图书馆界如何迎接大数据带来的各种挑战,如何利用大数据创新发展图书馆服务,如何提升图书馆在信息技术革命潮流中的竞争力,如何借助大数据带来的机遇突围图书馆事业发展的困境个瓶颈,成为当前图书馆界有待研究的重要理论和实践问题。
1.建设动态、优质的数据资源网络体系
(1)全面优化数据资源的手机存储。过去,无论是传统图书馆还是数字图书馆,主要侧重数字资源库、机构知识库、语义化信息等结构化数据的收集和存储,而对半结构化、非结构化数据关注较少。目前世界上非结构化数据占比高达80%以上,,如果对这部分数据忽视,将意味着对大部分有价值的信息视而不见。大数据时代,半结构化、非结构化数据的收集、存储和开发运用技术得以突破和迅速发展。为此,图书馆数据收集存储中应延伸到所有承载人类文明记录的资源,即全媒体资源,要多关注半结构化、非结构化数据收集,包括邮件、视频、微博、页面点击等数据。图书馆可以在服务中积极运用web2.0技术,开辟交互式共享平台,开设用户互助吧、论坛、社区等栏目,为馆员和用户、用户与用户之间开辟实时的交流通道,了解读者的阅读爱好和阅读习惯。积极通过射频识别〔RFID )、门禁通过等技术,收集日常用户的身份关系、借阅记录、存储信息行为、搜索方式、行为痕迹等结构化和非结构化信息。由此,让图书馆收集存储的信息“活起来”,成为立体化、动态性、关联性的知识谱系。
(2)联通数据资源的共享网络。大数据时代下,超体量的数据迅速增长,单个图书馆要对如此庞大的数据群进行收集、存储不仅不可能,也毫无必要,必须形成协调合作网络体系,才能真正实现数据的共有共享,提升信息服务能力。随着分布式缓存、大规模并行处理〔MPP )数据库、分布式文件系统、云计算平台、各种NoSQL分布式存储系统等大数据技术的运用,很大程度上加强了数据收集、存储和共享能力,为图书馆在资源共享网络建设方面提供了巨大的技术支持和发展前景。具体说,图书馆在推进数据资源网络体系建设中,首先,深化图书馆数字化,把各类资源转化为电子数据,在此基础上,共同推进全国乃至全世界图书馆资源共享。虽然我国目前没有任何一所图书馆占有的数据资源达到了PB级,但全国图书馆数据资源总量却是一个庞大的数据集。
2推动公共数据的存储、公开和挖掘
(1)搭建政府公共数据连接池。大数据时代,政府政务的数字化及政务数据的透明化迅速增强,政府作为公共数据“托管人”,为公众提供访问数据窗口成为不可逆转的潮流。我国正处于城镇化高速发展、民主法治迅速推进的转型期,通过开发政府公共数据,对缓解交通拥堵、资源紧缺等问题,消除社会争端、群体对抗等矛盾、显得极为迫切。这也是大数据最具潜力的应用领域之一。图书馆作为法定的政府信息公开承办单位、在当前管理体制下、就推动政府数据公开方面可作为的还很有限。但公开是一种趋势、而且也正在不断推进中、图书馆应该在可为的范围内、充分利用大数据技术、积极搭建政府公共数据连接池、不断推进公共数据的开放。
(2)做科研数据监护的引领者。我国除重大科研项目采取了有规划的数据管理外、大部分科研数据仍处于无序状态、这对于大数据时代下的科研创新将造成无法估量的损失。图书馆在数据监护工作中所承担的职责包括分析数据集合的存储、数据管理规划、最佳实践经验传播、收集与传播數据集合以及完成数据保存标准的制定等。而大数据时代、在超大体量数据的收集、存管、共享技术方面有较大发展、为图书馆履行数据监护职责、嵌入到科研一线获取数据、对数据进行持续系统性维护、根据科学研究需要推送数据服务等方面提供了重要支持。为此、我国图书馆特别是高校图书馆、应抓住这一发展机遇、创新服务业务、提升能力水平、通过为科研项目提供数据监护服务、抢占科研数据发布、存储、利用和管理的重要阵地、扩大图书馆服务效益。
3大数据时代图书馆服务的发展与创新
3.1借助数据挖掘技术深化图书馆的知识服务
大数据时代、带来了更丰富的数据资源和更专业的数据分析技术、形成了新的解决问题的思维模式、提供了更广阔的信息合作视野,为数据分析业务带来了重大变化和支撑、也为知识服务向专业化、个性化、决策与创新型发展、带来了巨大的发展机遇。图书馆是人类社会的知识宝库和智慧发源地、充分利用大数据的各种技术、迅速转变数据处理的范围、方式、对象、目的等理念和方式、积极推进图书馆信息服务等传统业务向数据分析、数据挖掘方向转移、开展更有深度、广度的知识服务、把为政府、企业等做各类数据分析服务、数据挖掘服务变为大数据时代图书馆的常态服务内容。这将是大数据时代、图书馆服务发展和创新最具挑战的领域、也将是催生图书馆服务创新发展的新的平台和机遇、更是图书馆现代服务的生成及实现的基本途径。
3.2提升图书馆服务的针对性和个性化
(1)增强阅读推广服务的效果。目前、图书馆在阅读推广方面的工作存在许多不足、特别是可持续性、实效性方面待提升。据资料显示、亚马逊网站充分利用大数据相关性分析、通过有效的图书推荐使其图书销售量增加三分之一以上。人们之所以阅读、也是基于推荐的理由。在大数据时代、图书馆也可以通过广泛的数据分析、如通过对读者借阅情况、书籍出版信息、社交网站评论、经济社会发展状况等各类数据分析、找出各类相关性、了解特定时期、特定群体的知识需求、阅读薄弱点以及阅读兴奋点和关注点、主动创新方法有针对性地开展阅读推广工作。不仅可开展面上的阅读推广、也可开展点对点的阅读推广。例如、通过收集和分析读者借阅情况、生活阅历、工作岗位等方面的半结构化、非结构化数据、总体把握读者的阅读习惯和知识需求、有针对性地向其开展图书推荐、知识推送等工作、增强阅读推广效果。
(3)提升社区图书馆、流动图书馆等工作效率。研究表明、当前、我国图书馆利用率低的一个重要原因是图书馆距离用户太远、当图书馆与用户保持合适距离、可有效促进公众对图书馆的利用。社区图书馆、流动图书馆等是图书馆深入用户、亲近用户的有效载体、是图书馆服务的“神经末梢”、扩大了图书馆辐射范围、本可以解决这一难题。但现实效果并不理想、普遍反应是“无法阅读到合适的、需要的图书”。造成这种情况的原因主要是社区图书馆、流动图书馆没有根据用户的需要有针对性地分派图书、及时更新书籍。
参考文献:
[1」肖强,郑立新.关联数据研完进展概述【J】.图书情报工作,3011 (13): 72-75, 134.
[2」任瑞娟,等.分布式本体编辑系统〔ADORES)的设计与实现【J】.现代图书情报技术,3011 (3):9一16.
[3」白海燕,乔晓东.基于本体和关联数据的书目组 织语义化研究【J】.现代图书情报技术3010(9):18一37.
【关键词】:大数据时代;数据挖掘;图书馆服务;知识服务
大数据时代的到来,必将对当前图书馆的发展理念、工作定位、服务模式等产生巨大冲击,图书馆事业亦将面临一个重大的抉择和发展起点。图书馆界如何迎接大数据带来的各种挑战,如何利用大数据创新发展图书馆服务,如何提升图书馆在信息技术革命潮流中的竞争力,如何借助大数据带来的机遇突围图书馆事业发展的困境个瓶颈,成为当前图书馆界有待研究的重要理论和实践问题。
1.建设动态、优质的数据资源网络体系
(1)全面优化数据资源的手机存储。过去,无论是传统图书馆还是数字图书馆,主要侧重数字资源库、机构知识库、语义化信息等结构化数据的收集和存储,而对半结构化、非结构化数据关注较少。目前世界上非结构化数据占比高达80%以上,,如果对这部分数据忽视,将意味着对大部分有价值的信息视而不见。大数据时代,半结构化、非结构化数据的收集、存储和开发运用技术得以突破和迅速发展。为此,图书馆数据收集存储中应延伸到所有承载人类文明记录的资源,即全媒体资源,要多关注半结构化、非结构化数据收集,包括邮件、视频、微博、页面点击等数据。图书馆可以在服务中积极运用web2.0技术,开辟交互式共享平台,开设用户互助吧、论坛、社区等栏目,为馆员和用户、用户与用户之间开辟实时的交流通道,了解读者的阅读爱好和阅读习惯。积极通过射频识别〔RFID )、门禁通过等技术,收集日常用户的身份关系、借阅记录、存储信息行为、搜索方式、行为痕迹等结构化和非结构化信息。由此,让图书馆收集存储的信息“活起来”,成为立体化、动态性、关联性的知识谱系。
(2)联通数据资源的共享网络。大数据时代下,超体量的数据迅速增长,单个图书馆要对如此庞大的数据群进行收集、存储不仅不可能,也毫无必要,必须形成协调合作网络体系,才能真正实现数据的共有共享,提升信息服务能力。随着分布式缓存、大规模并行处理〔MPP )数据库、分布式文件系统、云计算平台、各种NoSQL分布式存储系统等大数据技术的运用,很大程度上加强了数据收集、存储和共享能力,为图书馆在资源共享网络建设方面提供了巨大的技术支持和发展前景。具体说,图书馆在推进数据资源网络体系建设中,首先,深化图书馆数字化,把各类资源转化为电子数据,在此基础上,共同推进全国乃至全世界图书馆资源共享。虽然我国目前没有任何一所图书馆占有的数据资源达到了PB级,但全国图书馆数据资源总量却是一个庞大的数据集。
2推动公共数据的存储、公开和挖掘
(1)搭建政府公共数据连接池。大数据时代,政府政务的数字化及政务数据的透明化迅速增强,政府作为公共数据“托管人”,为公众提供访问数据窗口成为不可逆转的潮流。我国正处于城镇化高速发展、民主法治迅速推进的转型期,通过开发政府公共数据,对缓解交通拥堵、资源紧缺等问题,消除社会争端、群体对抗等矛盾、显得极为迫切。这也是大数据最具潜力的应用领域之一。图书馆作为法定的政府信息公开承办单位、在当前管理体制下、就推动政府数据公开方面可作为的还很有限。但公开是一种趋势、而且也正在不断推进中、图书馆应该在可为的范围内、充分利用大数据技术、积极搭建政府公共数据连接池、不断推进公共数据的开放。
(2)做科研数据监护的引领者。我国除重大科研项目采取了有规划的数据管理外、大部分科研数据仍处于无序状态、这对于大数据时代下的科研创新将造成无法估量的损失。图书馆在数据监护工作中所承担的职责包括分析数据集合的存储、数据管理规划、最佳实践经验传播、收集与传播數据集合以及完成数据保存标准的制定等。而大数据时代、在超大体量数据的收集、存管、共享技术方面有较大发展、为图书馆履行数据监护职责、嵌入到科研一线获取数据、对数据进行持续系统性维护、根据科学研究需要推送数据服务等方面提供了重要支持。为此、我国图书馆特别是高校图书馆、应抓住这一发展机遇、创新服务业务、提升能力水平、通过为科研项目提供数据监护服务、抢占科研数据发布、存储、利用和管理的重要阵地、扩大图书馆服务效益。
3大数据时代图书馆服务的发展与创新
3.1借助数据挖掘技术深化图书馆的知识服务
大数据时代、带来了更丰富的数据资源和更专业的数据分析技术、形成了新的解决问题的思维模式、提供了更广阔的信息合作视野,为数据分析业务带来了重大变化和支撑、也为知识服务向专业化、个性化、决策与创新型发展、带来了巨大的发展机遇。图书馆是人类社会的知识宝库和智慧发源地、充分利用大数据的各种技术、迅速转变数据处理的范围、方式、对象、目的等理念和方式、积极推进图书馆信息服务等传统业务向数据分析、数据挖掘方向转移、开展更有深度、广度的知识服务、把为政府、企业等做各类数据分析服务、数据挖掘服务变为大数据时代图书馆的常态服务内容。这将是大数据时代、图书馆服务发展和创新最具挑战的领域、也将是催生图书馆服务创新发展的新的平台和机遇、更是图书馆现代服务的生成及实现的基本途径。
3.2提升图书馆服务的针对性和个性化
(1)增强阅读推广服务的效果。目前、图书馆在阅读推广方面的工作存在许多不足、特别是可持续性、实效性方面待提升。据资料显示、亚马逊网站充分利用大数据相关性分析、通过有效的图书推荐使其图书销售量增加三分之一以上。人们之所以阅读、也是基于推荐的理由。在大数据时代、图书馆也可以通过广泛的数据分析、如通过对读者借阅情况、书籍出版信息、社交网站评论、经济社会发展状况等各类数据分析、找出各类相关性、了解特定时期、特定群体的知识需求、阅读薄弱点以及阅读兴奋点和关注点、主动创新方法有针对性地开展阅读推广工作。不仅可开展面上的阅读推广、也可开展点对点的阅读推广。例如、通过收集和分析读者借阅情况、生活阅历、工作岗位等方面的半结构化、非结构化数据、总体把握读者的阅读习惯和知识需求、有针对性地向其开展图书推荐、知识推送等工作、增强阅读推广效果。
(3)提升社区图书馆、流动图书馆等工作效率。研究表明、当前、我国图书馆利用率低的一个重要原因是图书馆距离用户太远、当图书馆与用户保持合适距离、可有效促进公众对图书馆的利用。社区图书馆、流动图书馆等是图书馆深入用户、亲近用户的有效载体、是图书馆服务的“神经末梢”、扩大了图书馆辐射范围、本可以解决这一难题。但现实效果并不理想、普遍反应是“无法阅读到合适的、需要的图书”。造成这种情况的原因主要是社区图书馆、流动图书馆没有根据用户的需要有针对性地分派图书、及时更新书籍。
参考文献:
[1」肖强,郑立新.关联数据研完进展概述【J】.图书情报工作,3011 (13): 72-75, 134.
[2」任瑞娟,等.分布式本体编辑系统〔ADORES)的设计与实现【J】.现代图书情报技术,3011 (3):9一16.
[3」白海燕,乔晓东.基于本体和关联数据的书目组 织语义化研究【J】.现代图书情报技术3010(9):18一37.