大数据时代图书馆数据科学家培养路径探析

来源 :科技风 | 被引量 : 0次 | 上传用户:yuhaolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  DOI:10.19392/j.cnki.16717341.201714245
  摘要:在大数据时代,图书馆将在数据搜集、数据分析、数据处理等方面面临巨大的挑战,复杂数据的处理或将成为图书馆发展的方向。由此,图书馆数据科学家的作用显得越发重要。文章主要分析了图书馆数据科学家做什么,如何培养图书馆数据科学家以适应大数据时代的图书馆发展需要。
  关键词:大数据;图书馆数据科学家;数据科学家;数据素养
  1 数据科学家与图书馆数据科学家
  数据科学家(Data Scientist)一词是由Natahn Yau在2009年提出来的。什么是数据科学家目前还没有统一的定义,普遍认可的是:“数据科学家是指运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对使用者有意义的信息,以易懂的形式传达给使用者和决策者,并创造出新的数据运用服务的人才”。
  在大数据时代,大数据具有信息类型繁多,更新速度快,综合价值大等眾多特性,如何选择可靠、更有价值的信息,进而进行分析、处理以为领导的战略决策提供参考,满足学校教学科研的需求,满足用户个性化服务的需要,是当今图书情报工作人员面临的重要挑战。因此,图书馆员只有快速的向数据科学家转变,才能适应大数据时代的图书馆发展需要而不被淘汰。
  2 图书馆数据科学家做什么
  笔者于2017年4月24日至28日在西南交通大学(九里堤校区)参加了为期5天的“图书馆数据科学家技术培训班”,通过学习,了解了大数据理念在实践运用中的一些成功案列;了解了信息搜集的一些成功案例;了解了使用Lucidworks Fusion对数据进行整合搜索和挖掘;了解了有关数据可视化的知识;掌握了利用Xpath来抓取京东、当当的图书信息,以及抓取外文图书数据库、期刊数据库、外文学位论文数据库的内容。
  通过学习,个人认为图书馆数据科学家可以完成以下这些工作。
  2.1 采集分析图书馆各类大数据,为图书馆的建设、管理、服务提供决策支持
  图书馆数据科学家的首要任务便是对各类馆藏数据的采集和分析。比如对用户的进馆阅览记录、借阅记录、图书馆的馆藏书目检索记录、用户访问数据库的记录等这些用户行为数据进行分析和处理。通过这些数据,我们可以分析用户的访问时间、阅读倾向和使用习惯等,从而帮助我们分析和预测用户的信息需求,以为图书馆的建设、管理、服务提供决策支持。因此,图书馆应重视各类数据的采集、整理和分析。
  2.2 培养用户的数据素养
  目前,国外图书馆探索数据素养教育越发系统,并在长期实践中形成了较为成熟的教育模式,就如何确定教学对象、设置教学目标、设计教学大纲、选定教学方法和实施教学评价等方面累积了丰富的经验和成果。而纵观国内高校,目前大学生的数据素养水平差别巨大,对数据采集、处理和利用数据的能力普遍较低,在数据伦理道德上的观念比较薄弱。由此,高校图书馆开展对用户的数据素养教育显得迫在眉睫。
  2.3 统计分析学校科研论文数据
  图书馆数据科学家还有一个重要任务便是搜集整理学校的科研论文数据,通过分析提供科研论文分析报告,以促进学校科研水平再上新台阶。
  2.4 开展大数据相关的培训讲座
  为了提高学校的整体数据素养,图书馆数据科学家可以为学校的师生开展大数据相关的讲座培训。介绍数据在论文中的重要作用,因为从众多核心期刊论文中我们可以看出,高质量的论文一般都有大量真实可靠的数据来做支撑。
  3 图书馆数据科学家培养路径
  3.1 提高图书馆员的数据素养
  在大数据时代,数据素养已成为21世纪公民必备的技能,尤其是在数据密集型的科研范式下,研究人员创建、获取、存储及运用数字科研数据的能力已成为推动科技进步、应对经济和社会挑战创新的关键,并对全球生产力、竞争力和生活质量具有潜在影响。因此,只有馆员具备较高的数据素养后才有基础和能力为用户提供有关数据的服务以及培养用户的数据素养。
  3.2 优化图书馆员的知识能力结构
  科学数据管理人才的知识结构总体上应由计算机技能、数据管理理论、管理学知识和其他相关学科知识组成。而图书馆数据科学家则应具备系统的管理学知识和丰富的管理实践经验,懂得数据管理的一般理论,初通计算机知识,并具有较强的执行力和组织协调能力。随着图书馆参与科学数据管理进程的加快,数据科学家的作用越来越突出,他们是图书馆科学数据服务的领导者,主要任务是制订图书馆数据化管理和发展战略,因此数据科学家应该是既具备信息技术及相关理论知识,也精通管理、战略和实践的通才。同时,由于数据科学家所处职位和承担的责任要求,需具备较强的规划策划能力、分析判断能力以及项目执行能力,以及领导图书馆的科学数据管理队伍的建设能力。
  3.3 掌握大数据分析处理工具
  由于图书馆数据科学要处理巨量的数据,因此,其必须掌握常用的数据采集工具,例如Hadoop、Spark、Map Reduce、Mahout、Xpath等,要熟悉大数据应用案例,要掌握信息可视化、数据挖掘等相关技术。
  3.4 加强外语知识的学习
  由于图书馆数据科学家应具备较好的信息技术及相关理论知识,要掌握大数据采集、分析和处理工具,而这些最新的理论知识、处理工具及科研成果往往都是最先出现在外文文献中。图书馆员只有具备较好的外语水平才能理解和传递这些信息,否则不能充分利用它以为用户提供服务。因此,图书馆数据科学家还应具备较高的外语水平。
  4 结语
  随着信息技术不断发展,大数据的优势将在日常生活中体现得更加淋漓尽致,民众也将随着这些人性化、个性化的高满意度服务的出现而对图书馆的服务呈现出明确和迫切的需求。
  因此,各类型图书馆在未来的发展中都应高度重视和培养本单位的图书馆数据科学家,这样才能适应大数据时代的图书馆发展需要。
  参考文献:
  [1]王伯秋.数据科学家及其对图书馆未来发展的作用[J].医学信息学杂志,2014,35(6).
  [2]胡卉.国外图书馆数据素养教育最佳实践研究与启示[J].现代情报,2016,36(8).
  [3]崔涛.图书馆视角下科学数据管理人才培养模式研究[J].图书馆建设,2017(3).
  [4]朱扬勇.大数据时代的数据科学家培养[J].大數据,2016(3).
  [5]田伟.大数据时代档案馆服务创新研究[J].档案学研究,2014(5).
其他文献
克拉玛依白碱滩区217国道与迎春路、支路交叉口形式不规范以及交通安全设施设置不合理等问题造成了一定的交通安全隐患。针对交叉口的形式、交通流组织及服务水平进行分析。
2016年,稠油生产形势异常严峻,成本挑战前所未有.新疆油田公司工程技术研究院SAGD项目组紧紧围绕超稠油生产降本增效目标,持续方案优化,在SAGD快速启动井注汽方式、举升杆柱
61#原油处理站是重油公司下属的4 个处理站之一。于1998 年12 月1 日建成投产,站上共有大小设备96 台,操作人员41人,房间面积886m2,站上冬季保温系统是1998 年建站同时修建的汽暖
DOI:10.19392/j.cnki.16717341.201722191  摘要:我国加入WTO后,经济不断快速的发展,随着经济的发展,人们的需求日益增加,对文化精神的追求也在不断地增加,因此文化产业就成为了加快经济发展的又一个新兴产业。而内蒙古是一个历史悠久,有浓郁的文化情操,独特的民族风情的自治區。内蒙古的草原文化、昭君文化等具有民族特色的文化在文化产业发展方面具有自身独特的优势,再加上传
单井输油管线冬季运行时,产出液温度受众多因素影响,其温度的准确性影响工艺设计参数及管路正常安全运行。基于水平管路传热特点和气液两相流理论建立了单井输油管路温度分布
摘 要:毛麻绣是具有地域特色的中国民间艺术形式,在以陕西洛川毛麻绣与浙江淳安毛麻绣为引领的中国南北地区毛麻绣不断传承与发展。本文以中国南北地区毛麻绣的延续与发展为研究中心,对毛麻绣进行简要介绍,重点对其发展现状与影响因素进行分析,目的在于探讨出有效促进南北地区毛麻绣的传承,促进中国民间艺术的发展。  关键词:南北地区;毛麻球;传承;发展  中国民间艺术十分丰富,在经济与文化高速发展的现代化社会中,
新《环保法》实施后,使热力公司燃煤锅炉房倍感压力。新标准的出台考核量化指标非常明确,监测方式也以CEMS在线监测为主;对技术数据进行了分析,提出了合理配风燃烧锅炉最优化、调整燃烧方式、精细化管理等建议。
<正> 为了有意识地发挥学生的主动性、积极性以及培养学生的自学能力、分析问题解决问题的能力,我们在《化工热力学》教学中,开展课外选论活动的尝试。以自选专题的形式,利用
河南省沁阳市太行办事处发挥地处城区的地理优势,积极发展"城市经济",把满足市民生活需要的"菜篮子"、"气罐子"、游园子",作为经济工作的重中之重来抓,取得显著的经济效益。1
随着石油天然气勘探开发的规模加大,取心作业的工作量也逐年增多,由于取心作业频繁提下钻、在油层段作业、部分井作业周期长等原因,容易引发井漏、溢流、甚至井喷等复杂事故