论文部分内容阅读
[摘 要] 高校图书馆是知识收藏与学术成果积淀的核心场所,是满足高校师生甚至校外读者信息需求的信息平台。读者的借阅行为蕴含了大量的互动信息,科学地提取这些信息对于掌握读者兴趣,加强图书馆资源整合与利用具有一定的参考价值。本文从数据挖掘技术的层面对当前高校图书馆信息化管理进行研究分析,为提高图书资源利用率、改进图书馆服务质量、合理配置文献资源提供理论和实践借鉴。
[关键词] 高校图书馆;信息化管理;数据挖掘
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016. 17. 108
[中图分类号] G251;TP391 [文献标识码] A [文章编号] 1673 - 0194(2016)17- 0190- 01
1 数据挖掘功能与过程
从数据处理的视角来看,数据挖掘的功能在于从数据库中发现隐含的、有意义的知识,通常包括描述性挖掘与预测性挖掘两类。对于高校图书馆的数据库系统而言,数据挖掘技术能够从海量的读者信息中刻画一般属性,并在当前数据的基础上进行推断,从而达到预测的目的。通常数据挖掘技术可以发现以下知识类型:利用概念描述得到广义知识,利用关联分析得到关联知识,利用分类和聚类方法得到分类知识,利用预测方法得到预测型知识,利用偏差检测得到偏差型知识。数据挖掘的过程通常分为四个步骤,即确定领域对象、数据准备、挖掘操作、结果表达和分析。
2 高校图书馆信息化管理中数据挖掘技术需求分析
2.1 高校图书馆的数据特点
高校图书馆是高校进行教学和科研活动获取知识的重要来源,并且随着图书馆网络数字化发展步伐的不断加快,图书馆的服务模式发生了巨大变化,信息需求的多样性、需求方式的多元化使得图书馆面临大量的数据需要处理。高校图书馆的数据一般来说具备以下三个方面的特点:一是数据的海量性,不仅包括文献资料、数字资料等馆藏数据,还包括读者借阅、信息需求等数据信息;二是图书馆数据的关联性,即图书馆信息处理系统所积累的大量借阅数据之间存在一定的关联性;三是信息的潜在性,即隐含在图书馆大量数据中非常有价值的信息,这些信息需要进行数据挖掘才能够变成真正有用的数据。
2.2 高校图书馆对于数据挖掘技术的需求
从高校图书管目前所提供的主要服务模式来看,“借、阅、还”以及“信息咨询”是主要服务类型,但随着信息需求的个性化、信息获取方式的多元化发展,图书馆需要借助网络智能技术来拓展自身的服务范围,提高图书馆信息利用的有效率,能够深层次挖掘读者的真实需求,为每位读者提供个性化服务,而这些需要数据挖掘技术的支撑。数据挖掘技术在高校图书馆中的需求主要包括三个层面:一是读者群与借阅行为模式分析,即叙述统计、孤立点分析;二是个性化服务工作,即关联规则分析、时间序列分析;三是文献排架管理需求。
3 数据挖掘技术在高校图书馆中的应用设计
3.1 信息系统总体框架
数据挖掘技术在高校图书馆信息管理系统及数据库中的实践应用,可基于高校图书馆网站系统,采用三层结构体系设计,从信息收集的入口开始,到数据库层面进行深层次的数据挖掘。用户界面层由一系列交互的页面组成,主要实现用户通过该层对图书馆网站进行访问,并获取访问者的实际需求信息;业务逻辑层实现的是应用程序的业务功能,包括多个模块,比如用户注册与登陆、图书资源搜索与预定、图书智能推荐等;数据访问层提供对外部数据库的访问,完成查询、插入、删除和修改数据库中数据的功能。
3.2 图书馆管理数据仓库设计
数据库设计在高校图书馆信息管理中至关重要,是实现数据挖掘功能的基础。基于数据挖掘需求的高校图书馆数据库由注册认证库与图书馆信息库组成,其中图书馆信息库又包括图书信息、读者信息、管理员采购图书清单、用户图书预定需求单、图书借阅历史列表、新购图书单、出版信息实体等7个实体。为提高图书馆系统数据库的数据处理能力,所有SQL调用都是使用存储过程来完成的,调用存储过程必须使用参数进行传递,进而提高系统安全性。
3.3 聚类分析应用
高校图书馆数据库系统中实现数据挖掘功能的数据挖掘模块根据数据处理所得数据集,应用挖掘技术实现对信息的挖掘,并将结构存储下来,这是数据挖掘技术在高校图书馆中聚类分析的具体应用。在进行聚类分析设计时,应实现以下几个方面的挖掘:一是读者聚类,即依据读者使用情况进行读者群划分;二是图数聚类,即根据图书被借阅的次数进行聚类分析以得到有价值的信息,进而能够对图书馆的文献资料采购进行合理的分配。
3.4 关联规则应用
首先,图书馆信息系统提供的检索功能可以实现读者关键词分析,进而分析出读者的阅读兴趣和需求方向,为读者提供个性化的智能推荐服务,以及提供更多有用的信息;其次,结合读者和文献资料之间的借阅关联进行数据准备,分析二者之间的关联性,并建立关联规则;最后,在数据关联的基础上实现图书智能推荐服务,具体步骤为:建立训练模型→建立在线查询服务→输出智能推荐。
[关键词] 高校图书馆;信息化管理;数据挖掘
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016. 17. 108
[中图分类号] G251;TP391 [文献标识码] A [文章编号] 1673 - 0194(2016)17- 0190- 01
1 数据挖掘功能与过程
从数据处理的视角来看,数据挖掘的功能在于从数据库中发现隐含的、有意义的知识,通常包括描述性挖掘与预测性挖掘两类。对于高校图书馆的数据库系统而言,数据挖掘技术能够从海量的读者信息中刻画一般属性,并在当前数据的基础上进行推断,从而达到预测的目的。通常数据挖掘技术可以发现以下知识类型:利用概念描述得到广义知识,利用关联分析得到关联知识,利用分类和聚类方法得到分类知识,利用预测方法得到预测型知识,利用偏差检测得到偏差型知识。数据挖掘的过程通常分为四个步骤,即确定领域对象、数据准备、挖掘操作、结果表达和分析。
2 高校图书馆信息化管理中数据挖掘技术需求分析
2.1 高校图书馆的数据特点
高校图书馆是高校进行教学和科研活动获取知识的重要来源,并且随着图书馆网络数字化发展步伐的不断加快,图书馆的服务模式发生了巨大变化,信息需求的多样性、需求方式的多元化使得图书馆面临大量的数据需要处理。高校图书馆的数据一般来说具备以下三个方面的特点:一是数据的海量性,不仅包括文献资料、数字资料等馆藏数据,还包括读者借阅、信息需求等数据信息;二是图书馆数据的关联性,即图书馆信息处理系统所积累的大量借阅数据之间存在一定的关联性;三是信息的潜在性,即隐含在图书馆大量数据中非常有价值的信息,这些信息需要进行数据挖掘才能够变成真正有用的数据。
2.2 高校图书馆对于数据挖掘技术的需求
从高校图书管目前所提供的主要服务模式来看,“借、阅、还”以及“信息咨询”是主要服务类型,但随着信息需求的个性化、信息获取方式的多元化发展,图书馆需要借助网络智能技术来拓展自身的服务范围,提高图书馆信息利用的有效率,能够深层次挖掘读者的真实需求,为每位读者提供个性化服务,而这些需要数据挖掘技术的支撑。数据挖掘技术在高校图书馆中的需求主要包括三个层面:一是读者群与借阅行为模式分析,即叙述统计、孤立点分析;二是个性化服务工作,即关联规则分析、时间序列分析;三是文献排架管理需求。
3 数据挖掘技术在高校图书馆中的应用设计
3.1 信息系统总体框架
数据挖掘技术在高校图书馆信息管理系统及数据库中的实践应用,可基于高校图书馆网站系统,采用三层结构体系设计,从信息收集的入口开始,到数据库层面进行深层次的数据挖掘。用户界面层由一系列交互的页面组成,主要实现用户通过该层对图书馆网站进行访问,并获取访问者的实际需求信息;业务逻辑层实现的是应用程序的业务功能,包括多个模块,比如用户注册与登陆、图书资源搜索与预定、图书智能推荐等;数据访问层提供对外部数据库的访问,完成查询、插入、删除和修改数据库中数据的功能。
3.2 图书馆管理数据仓库设计
数据库设计在高校图书馆信息管理中至关重要,是实现数据挖掘功能的基础。基于数据挖掘需求的高校图书馆数据库由注册认证库与图书馆信息库组成,其中图书馆信息库又包括图书信息、读者信息、管理员采购图书清单、用户图书预定需求单、图书借阅历史列表、新购图书单、出版信息实体等7个实体。为提高图书馆系统数据库的数据处理能力,所有SQL调用都是使用存储过程来完成的,调用存储过程必须使用参数进行传递,进而提高系统安全性。
3.3 聚类分析应用
高校图书馆数据库系统中实现数据挖掘功能的数据挖掘模块根据数据处理所得数据集,应用挖掘技术实现对信息的挖掘,并将结构存储下来,这是数据挖掘技术在高校图书馆中聚类分析的具体应用。在进行聚类分析设计时,应实现以下几个方面的挖掘:一是读者聚类,即依据读者使用情况进行读者群划分;二是图数聚类,即根据图书被借阅的次数进行聚类分析以得到有价值的信息,进而能够对图书馆的文献资料采购进行合理的分配。
3.4 关联规则应用
首先,图书馆信息系统提供的检索功能可以实现读者关键词分析,进而分析出读者的阅读兴趣和需求方向,为读者提供个性化的智能推荐服务,以及提供更多有用的信息;其次,结合读者和文献资料之间的借阅关联进行数据准备,分析二者之间的关联性,并建立关联规则;最后,在数据关联的基础上实现图书智能推荐服务,具体步骤为:建立训练模型→建立在线查询服务→输出智能推荐。