论文部分内容阅读
摘要:数据挖掘技术是图书馆用户行为分析的重要方法和工具。图书馆流通数据是图书馆业务流程优化的重要依据之一。以苏州工业园区独墅湖图书馆青少年卡为例分析分析其借阅情况。
关键词:数据挖掘;流通数据;图书推荐
图书馆借阅信息是伴随着图书馆门户公开化而诞生的副产品,但其在馆藏采购、馆藏管理、读者需求分析等方面具有不可忽视的作用。随着图书馆资源和管理数字化进程加快,每日都会从图书馆管理系统中产生庞杂的表单信息,如何让信息从无序到有序,便于从中了解读者借阅兴趣与倾向、馆藏图书的利用率,有必要对流通数据进行深度剖析。。并以此为客观依据,向读者提供积极、主动、个性化信息服务,这也与泛在图书馆所要求打破被动服务壁垒,提高以读者驱动为导向的主动服务意识的宗旨相一致。
一、数据挖掘技术在图书馆管理中的具体应用
(一)用户资源管理
用户就是指日常中,经常利用图书馆来获取自己所需的信息资源和信息服务的所有个人及集体。图书馆在长期的为用户提供信息服务过程中,慢慢的积累了许多的用户信息资源。我们运用数据挖掘的先进技术,对用户信息资源进行仔细的分析和统计,就可以了解到用户对图书馆信息资源的需求服务需求是什么,这样我们就可以针对不同的个性化需求,制定出符合用户需求的信息资源建设和服务措施,最终完成与用户需求信息的收集。
(二)读者信息服务
如何给读者提供良好的信息服务,使读者可以简单快捷的查找、检索到所需的信息资源。我们要利用好数据挖掘技术,把各种类的信息数据进行整合,在把纸质的图书和各种操作平台的电子版信息,以四种规则给我们的读者提供完整统一的一个信息数据平台,这样就会使读者提高了查找、检索信息的命中率。
由于现在网络信息技术非常广泛,个人的很多信息都被收集和分析,因此我们要做好读者个人信息的管理,解决好隐私保护和信息安全的合法性,确保每位读者的个人信息安全。
(三)图书采购管理
我们利用数据挖掘技术,把流通数据库和采访数据库中的历史记录数据进行关联性分析和序列分析,就能够非常容易的计算出图书文献的频繁借阅信息集合,然后我们在进行科学合理的分析各类文献利用率,最后在把这科学准确的分析报告及对用户需求的预测提供给图书采购部门,这样采购部门就可以根据所提供的用户需求信息,进行科学的选择按需采购。
(四)图书借阅流量方面的周期分析
通过数据挖掘相关的技术,我们可以在数据库当中将流通量本身的周期性寻找出来,并且对读者的借阅高峰期以及借阅的低峰期进行有效地分析,与此同时,通过数据的有效地利用分析,对图书的流通部门进行有效地、科学的安排,在图书资源以及人力资源极为有限的情况下,针对读者提供更多全面、优质的图书服务,并且为所有的流通部门平日的工作提供具有科学性的参考以及分析。
(五)支持图书馆决策管理
管理的好坏是任何企业发展最重要的环节,在图书馆的管理上,科学的决策管理是体现图书馆整体管理水平的高低。利用数据挖掘技术提供信息,使图书馆的管理不用再像以往用经验去做决策。
二、基于数据挖掘的图书馆读者服务优化措施
通过对图书馆的资料仓库中储存的海量信息进行聚类分析、数据挖掘可以帮助图书馆优化读者服务提供行之有效的技术支持,其应用范畴主要集中在以下几个方面:
(一)个性化图书推荐
图书推荐是图书馆为读者提供个性化服务的一个重要举措利用数据挖掘技术获取的信息,比如读者的借阅历史记录、阅读兴趣或研究方向,可向其推荐相关专题或专业的最新资料;或者通过数据挖掘关联规则方法的使用,为读者检索提供关联借阅的信息,使读者检索含有A 关键字的书籍时,能够得到诸如“借阅过该图书的会员还借阅了”之类的信息,节省检索的时间和精力此外,对于某些缺少借阅经历或刚刚涉足专业学习的读者来说,很大的一个困惑就是不知道要借阅什么书,图书馆可以图书流通日志挖掘出各大类、分类书籍中借阅量最大的前几名书籍,作为图书推荐,或组织专家撰写各专业学习的书单,动态更新相关专业的优秀文献书目,以供读者借阅参考
(二)指导制定书籍采购计划
传统的图书采购计划制订主要采用专家法与经验法,但这种计划制订容易受到主观因素尤其是个人喜好的影响,花费大量资金购置的图书也可能并不能很好地满足读者的阅读需求那么,怎样才能将有限的资金用到最紧缺的资源上去呢? 运用数据挖掘技术分析图书馆的借阅流通记录、检索请求,以及文献拒借集和频繁借阅集,就能够很准确地获得信息采集的目标,进而有针对性的补充文献书籍并增加馆藏复本
(三)优化书库书架管理
图书馆文献资料集中,藏书量往往有上百万册甚至更多,所藏资料囊括了各个专业领域,为读者的学习提供服务由于藏书量大、种类繁多,科学、人性化的排架管理对于优化馆藏建设十分重要,数据挖掘技术的应用可以为图书管理员提供文献借阅量的变化趋势、购置时间的先后顺序,进而预留架位,避免频繁倒架,增加管理员工作量和读者的检索时间。
(四)读者借阅信用管理
图书资源作为公共财产,要保证有限的图书资源为尽可能多的读者服务,必须加强读者的借阅信用管理可以对逾期还书信息进行聚类分析,将多次逾期归还图书、借阅信用较低的读者纳入一个单独的群集,减少单次可借阅图书数量,并设立按时提醒还书的服务,通过手机短信、E m ail等途径提醒借阅者按时还书以方便其他读者的借阅。
三、我馆青少年卡借阅数量分析
以下数据均截取前10
园区中小学各学校借阅证使用情况(截止2014.11.11)
序号 学校名称 持证人数 借阅
总册数 人均借阅量 占总借阅量比例 备注
1 苏州工业园区莲花学校 2254 30493 13.53 16.55% 青少年卡发放正常,使用情况良好。 2 苏州工业园区第二实验小学 3201 24556 7.67 13.33%
3 苏州工业园区车坊实验小学 2135 21669 10.15 11.76%
4 苏州工业园区胜浦实验小学 2633 15554 5.91 8.44% 2013年下半年开始已经拒绝办证。
5 苏州工业园区娄葑实验小学 2695 13133 4.87 7.13% 青少年卡发放正常,使用情况良好。
6 苏州工业园区斜塘学校 1966 12673 6.45 6.88%
7 苏州工业园区青剑湖学校 2554 11745 4.60 6.38%
8 苏州工业园区方洲小学 1954 11180 5.72 6.07%
9 苏州工业园区翰林小学 739 9153 12.39 4.97%
10 苏州工业园区第八中学 864 7646 8.85 4.15%
说明:
1.发放的青少年卡借阅证数量为42696张,截止2014年11月11日借阅量为184226册,平均借阅量为4.31册/证。有效发放读者证(学校真正发放到学生手中的青少年卡)平均借阅量为5.33册/证。
2.以上序号排序按照各学校借阅数量排列。莲花学校、二实小、车坊实验小学、胜浦实小、娄葑实小、斜塘学校、青剑湖学校、方洲小学借阅总量相对比较高。
3.莲花学校、翰林小学、车坊实小人均借阅量相对比较高,人均借阅量均达10册以上。
4.由此说明,青少年卡的使用率与以下2个因素相关:①、与总分馆的距离越近,利用率越高;②、小学生因课业负担相对比较低,证件利用率也相对比较高。
青少年卡在总馆与各分馆的借阅情况(截止2014.11.11)
序号 馆藏地 册数 总分馆借阅量所占比例
1 A108青少年阅览室 60798 48.43%
2 B301文艺阅览室 13062
3 B101社科阅览室 14134
4 B303科技阅览室 652
5 B403工具书阅览室 18
6 流动服务车 456
7 其他 108
8 方洲邻里中心分馆 23160 12.57%
9 松泽社区分馆 20689 11.23%
10 浪花苑社区分馆 12142 6.59%
说明:
1.各学校在总馆的借阅量都相对比较集中。
总馆主要借阅量集中在青少年阅览室、文艺阅览室图书。
青少年借阅文艺阅览室言情类小说比较多,需引导;科技阅览室图书相对比较不适合青少年阅读,故借阅量比较少。
2.各分馆的借阅量主要受周边学校青少年卡发放情况影响;其次是学校的重视程度。
总馆借阅量为89228册,分馆借阅量合计为94998册。
【参考文献】
[1]]周志超,张远,侯胜超.高校图书馆流通数据挖掘的新思路[J].现代情报,2013(10):33-10
[2]王云青.数据挖掘技术在图书管理中的应用研究[J].邢台学院学报,2013(12):28-4
[3]张永恒.数据挖掘技术在省图书馆中的应用探索[D].2009
[4]施晓华.数据挖掘技术在图书馆学科数据馆藏分析中的应用[J].情报杂志,2011(1):164-168.
[5]李文阔,李水先《数据挖掘在毅字图书馆中的应用研究综述》[J],新世纪图书馆,2012,(2):30-33
[6]黄辉《谈数据挖掘技术在图书馆工作中的应用》[J].西北工业大学学报(社会科学版),2007(03):91-93
[7]张炜,洪霞.基于OPAC读者行为的知识发现研究[J].图书馆论坛,2011(01):17-19
[8]柯青.以用户为中心的研究范式—理论起源[J].情报资料工作,2008(04):51-55
[9]宋丽花.数据挖掘技术在读者服务优化中的应用[J].现代商贸工业,2013(23)
关键词:数据挖掘;流通数据;图书推荐
图书馆借阅信息是伴随着图书馆门户公开化而诞生的副产品,但其在馆藏采购、馆藏管理、读者需求分析等方面具有不可忽视的作用。随着图书馆资源和管理数字化进程加快,每日都会从图书馆管理系统中产生庞杂的表单信息,如何让信息从无序到有序,便于从中了解读者借阅兴趣与倾向、馆藏图书的利用率,有必要对流通数据进行深度剖析。。并以此为客观依据,向读者提供积极、主动、个性化信息服务,这也与泛在图书馆所要求打破被动服务壁垒,提高以读者驱动为导向的主动服务意识的宗旨相一致。
一、数据挖掘技术在图书馆管理中的具体应用
(一)用户资源管理
用户就是指日常中,经常利用图书馆来获取自己所需的信息资源和信息服务的所有个人及集体。图书馆在长期的为用户提供信息服务过程中,慢慢的积累了许多的用户信息资源。我们运用数据挖掘的先进技术,对用户信息资源进行仔细的分析和统计,就可以了解到用户对图书馆信息资源的需求服务需求是什么,这样我们就可以针对不同的个性化需求,制定出符合用户需求的信息资源建设和服务措施,最终完成与用户需求信息的收集。
(二)读者信息服务
如何给读者提供良好的信息服务,使读者可以简单快捷的查找、检索到所需的信息资源。我们要利用好数据挖掘技术,把各种类的信息数据进行整合,在把纸质的图书和各种操作平台的电子版信息,以四种规则给我们的读者提供完整统一的一个信息数据平台,这样就会使读者提高了查找、检索信息的命中率。
由于现在网络信息技术非常广泛,个人的很多信息都被收集和分析,因此我们要做好读者个人信息的管理,解决好隐私保护和信息安全的合法性,确保每位读者的个人信息安全。
(三)图书采购管理
我们利用数据挖掘技术,把流通数据库和采访数据库中的历史记录数据进行关联性分析和序列分析,就能够非常容易的计算出图书文献的频繁借阅信息集合,然后我们在进行科学合理的分析各类文献利用率,最后在把这科学准确的分析报告及对用户需求的预测提供给图书采购部门,这样采购部门就可以根据所提供的用户需求信息,进行科学的选择按需采购。
(四)图书借阅流量方面的周期分析
通过数据挖掘相关的技术,我们可以在数据库当中将流通量本身的周期性寻找出来,并且对读者的借阅高峰期以及借阅的低峰期进行有效地分析,与此同时,通过数据的有效地利用分析,对图书的流通部门进行有效地、科学的安排,在图书资源以及人力资源极为有限的情况下,针对读者提供更多全面、优质的图书服务,并且为所有的流通部门平日的工作提供具有科学性的参考以及分析。
(五)支持图书馆决策管理
管理的好坏是任何企业发展最重要的环节,在图书馆的管理上,科学的决策管理是体现图书馆整体管理水平的高低。利用数据挖掘技术提供信息,使图书馆的管理不用再像以往用经验去做决策。
二、基于数据挖掘的图书馆读者服务优化措施
通过对图书馆的资料仓库中储存的海量信息进行聚类分析、数据挖掘可以帮助图书馆优化读者服务提供行之有效的技术支持,其应用范畴主要集中在以下几个方面:
(一)个性化图书推荐
图书推荐是图书馆为读者提供个性化服务的一个重要举措利用数据挖掘技术获取的信息,比如读者的借阅历史记录、阅读兴趣或研究方向,可向其推荐相关专题或专业的最新资料;或者通过数据挖掘关联规则方法的使用,为读者检索提供关联借阅的信息,使读者检索含有A 关键字的书籍时,能够得到诸如“借阅过该图书的会员还借阅了”之类的信息,节省检索的时间和精力此外,对于某些缺少借阅经历或刚刚涉足专业学习的读者来说,很大的一个困惑就是不知道要借阅什么书,图书馆可以图书流通日志挖掘出各大类、分类书籍中借阅量最大的前几名书籍,作为图书推荐,或组织专家撰写各专业学习的书单,动态更新相关专业的优秀文献书目,以供读者借阅参考
(二)指导制定书籍采购计划
传统的图书采购计划制订主要采用专家法与经验法,但这种计划制订容易受到主观因素尤其是个人喜好的影响,花费大量资金购置的图书也可能并不能很好地满足读者的阅读需求那么,怎样才能将有限的资金用到最紧缺的资源上去呢? 运用数据挖掘技术分析图书馆的借阅流通记录、检索请求,以及文献拒借集和频繁借阅集,就能够很准确地获得信息采集的目标,进而有针对性的补充文献书籍并增加馆藏复本
(三)优化书库书架管理
图书馆文献资料集中,藏书量往往有上百万册甚至更多,所藏资料囊括了各个专业领域,为读者的学习提供服务由于藏书量大、种类繁多,科学、人性化的排架管理对于优化馆藏建设十分重要,数据挖掘技术的应用可以为图书管理员提供文献借阅量的变化趋势、购置时间的先后顺序,进而预留架位,避免频繁倒架,增加管理员工作量和读者的检索时间。
(四)读者借阅信用管理
图书资源作为公共财产,要保证有限的图书资源为尽可能多的读者服务,必须加强读者的借阅信用管理可以对逾期还书信息进行聚类分析,将多次逾期归还图书、借阅信用较低的读者纳入一个单独的群集,减少单次可借阅图书数量,并设立按时提醒还书的服务,通过手机短信、E m ail等途径提醒借阅者按时还书以方便其他读者的借阅。
三、我馆青少年卡借阅数量分析
以下数据均截取前10
园区中小学各学校借阅证使用情况(截止2014.11.11)
序号 学校名称 持证人数 借阅
总册数 人均借阅量 占总借阅量比例 备注
1 苏州工业园区莲花学校 2254 30493 13.53 16.55% 青少年卡发放正常,使用情况良好。 2 苏州工业园区第二实验小学 3201 24556 7.67 13.33%
3 苏州工业园区车坊实验小学 2135 21669 10.15 11.76%
4 苏州工业园区胜浦实验小学 2633 15554 5.91 8.44% 2013年下半年开始已经拒绝办证。
5 苏州工业园区娄葑实验小学 2695 13133 4.87 7.13% 青少年卡发放正常,使用情况良好。
6 苏州工业园区斜塘学校 1966 12673 6.45 6.88%
7 苏州工业园区青剑湖学校 2554 11745 4.60 6.38%
8 苏州工业园区方洲小学 1954 11180 5.72 6.07%
9 苏州工业园区翰林小学 739 9153 12.39 4.97%
10 苏州工业园区第八中学 864 7646 8.85 4.15%
说明:
1.发放的青少年卡借阅证数量为42696张,截止2014年11月11日借阅量为184226册,平均借阅量为4.31册/证。有效发放读者证(学校真正发放到学生手中的青少年卡)平均借阅量为5.33册/证。
2.以上序号排序按照各学校借阅数量排列。莲花学校、二实小、车坊实验小学、胜浦实小、娄葑实小、斜塘学校、青剑湖学校、方洲小学借阅总量相对比较高。
3.莲花学校、翰林小学、车坊实小人均借阅量相对比较高,人均借阅量均达10册以上。
4.由此说明,青少年卡的使用率与以下2个因素相关:①、与总分馆的距离越近,利用率越高;②、小学生因课业负担相对比较低,证件利用率也相对比较高。
青少年卡在总馆与各分馆的借阅情况(截止2014.11.11)
序号 馆藏地 册数 总分馆借阅量所占比例
1 A108青少年阅览室 60798 48.43%
2 B301文艺阅览室 13062
3 B101社科阅览室 14134
4 B303科技阅览室 652
5 B403工具书阅览室 18
6 流动服务车 456
7 其他 108
8 方洲邻里中心分馆 23160 12.57%
9 松泽社区分馆 20689 11.23%
10 浪花苑社区分馆 12142 6.59%
说明:
1.各学校在总馆的借阅量都相对比较集中。
总馆主要借阅量集中在青少年阅览室、文艺阅览室图书。
青少年借阅文艺阅览室言情类小说比较多,需引导;科技阅览室图书相对比较不适合青少年阅读,故借阅量比较少。
2.各分馆的借阅量主要受周边学校青少年卡发放情况影响;其次是学校的重视程度。
总馆借阅量为89228册,分馆借阅量合计为94998册。
【参考文献】
[1]]周志超,张远,侯胜超.高校图书馆流通数据挖掘的新思路[J].现代情报,2013(10):33-10
[2]王云青.数据挖掘技术在图书管理中的应用研究[J].邢台学院学报,2013(12):28-4
[3]张永恒.数据挖掘技术在省图书馆中的应用探索[D].2009
[4]施晓华.数据挖掘技术在图书馆学科数据馆藏分析中的应用[J].情报杂志,2011(1):164-168.
[5]李文阔,李水先《数据挖掘在毅字图书馆中的应用研究综述》[J],新世纪图书馆,2012,(2):30-33
[6]黄辉《谈数据挖掘技术在图书馆工作中的应用》[J].西北工业大学学报(社会科学版),2007(03):91-93
[7]张炜,洪霞.基于OPAC读者行为的知识发现研究[J].图书馆论坛,2011(01):17-19
[8]柯青.以用户为中心的研究范式—理论起源[J].情报资料工作,2008(04):51-55
[9]宋丽花.数据挖掘技术在读者服务优化中的应用[J].现代商贸工业,2013(23)