论文部分内容阅读
在数字化的时代里,数据收集与数据挖掘,被视为是单位制订政策与决策建立时的一项具有高度参考价值的信息。图书馆经营的目的就是要能够更符合读者的需求。主动发掘读者的需求,主动提供读者所需要的信息,便是现今图书馆重要的工作项目,而图书馆自动化系统便是读者积极满足个人信息需求的行为结果,也是读者使用图书馆资源的最佳证据。对图书馆的借阅历史记录进行数据挖掘和分析,以变图书馆的被动服务为主动服务,提高图书馆在校园里的整体形象。在数据挖掘的过程中,首先要先确定研究主题,本研究是以西南大学图书馆用户,在图书馆自动化系统中的借阅记录为轴心,并加入用户的基本数据来当作挖掘时的特性区分,经过数据的整理与数据的转换,建立数据仓库。针对所建立的数据仓库,作聚类分析、分类分析与关联规则分析的数据挖掘探勘,挖掘的项目以四个维度「图书」、「读者」、「时间」、「读者单位」做交叉分析,最后所得的结果即是用户使用图书馆的一个行为模式。这些行为模式除了是直接反映出用户使用图书馆的行为模式之外,同时针对这些模式来作分析,可以提供图书馆在做经营决策时,一个重要的而且客观的参考依据,这些经营决策包含了馆藏政策、图书推荐、预算分配以及图书馆经营等工作。本论文是利用数据挖掘技术探讨读者的行为模式,以西南大学图书馆的“金盘信息管理系统”中的历史借阅记录、西南大学图书馆馆藏、读者信息库为基础数据来源,运用数据挖掘技术来探索西南大学读者的社群特性,并运用数据挖掘的成果来提升图书馆的经营与服务,期望能使西南大学图书馆在西南大学的读者学术、知识吸收和运用中扮演更积极的角色。本论文拟探索的读者社群关系包含:1.馆藏借阅的共同性:有类似兴趣的读者通常所借阅的馆藏也会很类似,如果利用数据挖掘技术把馆藏借阅的共同性找出来?2.馆藏借阅的顺序:读者借阅馆藏可能会先借入门的再借深入的,如何用数据挖掘方法把读者借阅馆藏的顺序特性找出来?。当我们挖掘出读者的社群关系后,希望能运用这些社群关系和数据挖掘的相关技术达到以下的目的:1.吸引读者到管借阅:我们发现很多读者从未借阅过馆藏,要如何增加借阅的读者人数?2.提升馆藏的借阅率:我们发现有很多馆藏是未曾或极少被借阅的,要如何才能把这些馆藏推销出去呢?3.提升读者忠诚度:我们发现有很多读者只借一、两次就不再借阅,要如何提升读者的忠诚度,使读者能够持续地借阅?4.协助馆藏副本采购:图书馆针对一本书所采购的副本数往往有限,但有些热门书读者常常要预约很久才能借到,很多甚至是借不到,很多读者因此而放弃借阅。要如何找出哪些是热门的书?哪些该多买一本?5.促进馆藏流通率:过期还书对图书馆经营来说,是一个令人棘手的工作。很多热门的馆藏往往过期才归还,其他读者要借阅预约很久才能借到。因此针对读者逾期的状况来分析,找出经常逾期还书的特殊群体,可以在事前多做预防。6.时间序列的分析:对于开管时间是利用时间序列分析,找出是否于每周、每月甚至每季、每年中读者使用图书馆的时间规律性,一旦规则可以找出,将可作为图书馆开管时间延长或缩短的参考,这样的资讯尤其在寒、暑假,将更加重要,以数据挖掘技术所得的资讯,将可水副学校决策单位提供适当的人力,同时对于图书馆工作人员也更可以接受开管的时间。