数据挖掘技术在高校图书馆的应用概述

来源 :科学时代·上半月 | 被引量 : 0次 | 上传用户:nancyloveme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   [摘 要] 通过数据挖掘技术对数据进行更高层次的提取和分析, 更好地为读者提供深层次的服务,对馆藏建设也有很强的指导作用。本文主要总结数据挖掘技术在图书馆信息管理与服务方面的具体应用。
  [关键词] 高校图书馆 数据挖掘 个性化服务
  
  近年来,数据挖掘在许多领域得到广泛应用。数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询提升到从数据中挖掘有用的信息和知识,提供决策支持。随着数据库技术的迅速发展以及数据库管理系统在图书馆的广泛应用,在图书馆数据库中积累了大量读者对资源的访问历史数据,这些数据背后隐藏着许多重要的信息。从目前的图书馆管理系统中无法发现这些数据中存在的关系和规则,无法预测读者的信息需求,但人们可以通过对这些数据进行更高层次的提取和分析, 更好地为读者提供深层次的服务,对馆藏建设也有很强的指导作用。本文主要总结数据挖掘技术在图书馆信息管理与服务方面的具体应用。
  一、在信息资源建设中的应用
  信息采集是整个图书馆系统高效运转的基础,是决定馆藏质量的重要因素。随着出版物的数量、载体的形式日益增多,图书馆信息结构、读者需求与资金利用的平衡等问题越来越不易把握,也令采购工作的决策变得更加复杂,如何有效地使用有限的经费,充分利用宝贵的空间,添置读者真正需要的文献,提高文献资源的利用率成为当前高校图书馆采购工作面临的难题。目前采访人员的采购信息一般是通过各种预定书目,或者直接通过出版社、书商及读者推荐的书目等方式获取的。在具体需要购买哪些文献和确定每种文献的复本量时,采访人员一般是根据本馆的性质、任务和主要的服务对象来决定的。这样的采购模式过于刻板,易受采购人员的主观因素影响,势必造成一些本该购买的文献没有买,而不该买的文献却大量购入,或者某些文献的复本量太多,而另一些文献的复本量却又太少等现象。造成这一现象的原因主要就是缺乏对读者的需求做更具体的、科学的和全面的分析。一方面,我们可以利用数据挖掘技术对流通数据库和采访数据库中的历史记录数据进行数据的筛选、统计和分析,得到文献的拒借集和频繁借阅集,科学分析各类文献的利用率,为采购文献提供科学合理的分析报告,从而指导采访人员对文献种类进行科学地筛选,合理地确定各种文献所需的复本量,及时补充短缺的文献,剔除过时的文献,优化馆藏结构,真正做到为读者提供所需的资料。另一方面,通过收集整理图书馆网站上的在线调查、留言簿、读者调查表等数据,通过对这些数据进行挖掘,分析读者行为倾向,发现用户兴趣模式,就能动态的调整采购策略,有针对性地应对需求。
  数据挖掘方法是依据读者的需求来决定图书采购,最大限度地适应读者,有效扩大流通率,具有客观性,因数据挖掘是根据历史数据推知未来,所以其不足之处是不利于发现新学科、引导新方向。
  二、在信息资源馆藏布局中的应用
  通过对大量读者的借阅历史和阅读行为进行跟踪、关联分析及再预测,从中挖掘出受读者欢迎的藏书模式,从而作出相应的调整,这种藏书模式就是读者期望的藏书模式,或者说是读者最需求的藏书模式。
  比方说我们通过关联分析某一时间段内某类文献资料的外借历史数据,发现:在此段时间内读者甲和读者乙同时借阅文献A和文献B的概率是49%;借阅文献B的读者也借阅过文献C的概率是68%。图书馆可以根据此数据挖掘结果,合理调整馆藏布局,可将A、C图书放在B的附近,或建立图书B和A、C之间的链接,这样不但缩短了读者找书时间,也大大提高了书刊利用率,更好地为读者提供服务。
  书库的频繁倒架是较常遇到的问题,如何对之防微杜渐也是值得挖掘的一个方面。通过对历年采购数据和借阅数据的相关分析,增长幅度较大的图书种类在上架的时候应根据预测的趋势预留架位。
  三、在信息服务中的应用
  数据挖掘技术的应用拓宽了图书馆信息服务的范围,增加了信息服务的项目,使图书馆的信息服务变得更加主动,服务质量大大提高。
  数据挖掘技术在信息服务中的应用主要指为读者提供个性化信息服务。所谓个性化信息服务就是针对用户的特定需求主动地向读者提供经过集成的相对完整的信息集合或知识集合。个性化信息服务主要有三层意思:一是先让读者根据自己的需要进行信息订制,图书馆再按照订制的信息要求通过多渠道搜集、整理和汇总信息,提供给读者。这是读者先提出信息需求,然后才得到相应的服务,属于被动服务模式。二是信息智能推送,就是根据读者的信息来识别和预测读者的兴趣和偏好,从而有针对性地及时向读者主动推送相关信息,也就是挖掘读者兴趣模式,主动提供服务,使图书馆成为一个智能型、主动性的信息提供者。信息推送的形式多种多样,可根据不同的服务对象提供灵活多样的推送方式,如电话推送、手机短信推送、邮件推送、网页推送或直接上门推送等。信息智能推送的内容主要有:当馆内新进图书或期刊时,及时告知相关读者;当数据库有更新或有新的数据库试用时,及时告知读者;当读者访问图书馆资源时,随时根据此读者的兴趣度,推介相关专题信息;跟踪读者的兴趣变化,发现读者的最新需要;根据读者的兴趣,提供相应的预测报告、动态分析等。三是信息订制和信息推送有机结合,建立一个统一信息平台,让有着不同信息需求的不同读者群实现信息资源共享,并在此基础上,通过讨论和汇总生成新的信息资源,形成互动式服务模式。
  参考文献:
  [1]彭仪普、熊拥军,《关联挖掘在文献借阅历史数据分析中的应用》,情报技术,2005(8).
  [2]冯进,《利用数据挖掘技术 深入挖掘图书馆工作》,现代情报,2005(3).
  [3]石军,《数据挖掘在高校图书馆的应用》,江西图书馆学刊,2005(3).
  作者简介:
  张丽霞,滨州医学院(烟台校区)图书馆,现为青岛科技大学数理学院在职研究生。
其他文献
黏菌是森林生态系统中不可或缺的生物资源,在生态系统中发挥重要的作用.为了探讨黏菌在西北地区森林中的物种多样性及影响物种组成和多样性的因素,本文对甘肃省祁连山国家级
血红蛋白病是一种血红蛋白分子结构异常或合成速率改变所致的遗传性疾病,在世界上分布较广,我国沿海及南方地区均不断有所报导,尤以广东、广西、四川等省为常见。我们于1980
会议
【美联社华盛顿1981年9月18日电】科学家们说,干扰体内钙沉积或钙利用的药品,可防止猴动脉硬化,有可能对人也如此。在今日出版的《科学》杂志上刊出的一分报告说,研究人员称
请下载后查看,本文暂不支持在线获取查看简介。青年演员李冰冰 Please download to view, this article does not support online access to view profile. Young actress Li
会议
会议
会议
百忙之中山西行 李政道教授每年都要来北京两次,每次都把日程安排得满满的。这次来北京,原拟有一个月左右的访问和科研活动安排,可是,由于李先生在美国的科研教学工作也极其
本文的目的是利用丙烯醛解释烟雾提取物影响氨基酸掺入蛋白质到达什么程度。并比较了丙烯醛和纸烟烟雾水提取物对兔肺泡巨噬细胞中氨基酸掺入蛋白质的影响。作者观察了对照