数据挖掘技术在高校图书馆综合管理中的应用研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:m83692590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,数据采集和存储技术的发展使得许多数据库的数据量极其庞大,要从中分析有价值的信息、知识变得越来越困难,而这种分析需求却与同俱增。数据挖掘就是从海量数据中发现那些隐藏的、人们感兴趣的具有特定规律的信息,是一种发现知识、提取有用信息的过程,这些信息可以用来预测和决策。   高校图书馆与教师教学工作相辅相成的,在教书育人工作中起着不可估量的作用。同时,图书馆还可以帮助学生构建合理的知识结构,提高自学、使用信息和终身学习的能力。然而,国内数据挖掘应用于图书馆的研究,还大多是对图书馆读者行为和群体关系进行研究,没有真正运用到实际生活中。高校图书馆馆藏丰富,图书馆中数据量大,然而,数据库中的数据一直没有被充分利用,资源利用率低、信息开发不足。   本文使用SAS数据挖掘软件开展数据预处理和挖掘工作,在传统的高校图书馆管理系统中增加聚类算法和关联规则算法,实现读者群体划分的聚类,发现读者借阅信息之间的关联性。主要工作与成果有以下几点:   (1)总结目前国内高校图书馆管理现状,分析其存在的缺陷和不足,并简要分析数据挖掘技术运用到高校图书馆综合管理中的必要性。   (2)收集和整理图书馆中读者信息、借阅信息和馆藏信息等数据,确定数据挖掘目标,对数据进行清洗、空缺值填补和噪声数据剔除等预处理操作,根据需要将数据格式进行转换并导入到SAS和SQL Server2000中,为后续挖掘工作的开展准备数据。   (3)将SAS/EM模块作为本文数据挖掘的分析工具,建立聚类分析模型,实现读者群体聚类划分;建立关联规则分析模型,挖掘出读者借阅数据关联规则,为下一步实现图书推荐提供数据基础。   (4)在高校图书馆管理系统中增加数据挖掘功能,增加聚类分析和关联规则分析模块。聚类分析模块实现读者聚类和图书聚类,关联规则分析挖掘读者借阅图书的关联规则,实现图书推荐工作,从而提高图书馆的工作效率,改善图书馆的建设,为图书馆管理人员提高决策支持,帮助普通工作人员向信息专家转型。
其他文献
随着云计算、云存储技术的飞速发展,云环境下的信息安全问题也日益凸显,为了保护敏感数据的安全,需要对数据进行加密后上传,导致无法直接对明文进行操作。因此,在密文条件下
随着互联网和信息采集技术的发展,图像作为普遍使用的信息载体,其数量呈爆炸式增长。为了快速准确的检索到当前需要的图像,基于内容的图像检索(CBIR)逐渐兴起,由于其通用、高
基于通用多核的高性能网络包处理系统一直被广泛研究。本文基于通用多核平台设计实现了一个从网络输入输出系统到流水并行包处理应用全程零拷贝的高性能网络包处理平台。该平
所谓秘密共享,就是将秘密信息分割成多个子秘密分发给团体中的成员,当且仅当特定的多个成员合作时才能恢复出原来的秘密信息,而在其他情况下,和秘密相关的任何信息都不会被泄
人们对高性能计算的需求从来没有停止。然而已经非常完善的指令并行技术受线延迟和功率墙的制约,很难进一步带来性能提升,相反存储墙问题使得访存行为对性能的决定性越来越明显
信息时代高效率快节奏的工作使人们忽视那些看似与正常系统运行关系不大其实贯彻全局的安全工作,终于使得安全工作的匮乏到达了引爆点。近年来的有线网安全事件呈指数级上升,使
信息隐藏是信息安全研究的重要方面之一,而隐写术作为信息隐藏的一个主要分支,越来越受到国内外科研人员的关注。隐写术利用载体中的冗余信息嵌入秘密对象,以此实现秘密信息
随着社会信息化和数字化的发展,特别是数字家庭概念的发展,家庭中各种电器设备、多媒体设备网络化和信息化的加速发展,这些促使多种不同业务在家庭网络中同时呈现,而不同业务对带
基于达尔文进化论的进化算法在求解问题时,可将问题描述成自然界中种群的进化过程,遵循适者生存的机制,通过种群的不断进化,求得最优解或满意解。进化计算的研究较早,发展较
无线传感器网络(简称传感网)很多应用都依赖于节点的位置信息,所以节点定位技术是传感器网络领域中一种非常重要的基础技术。然而传感网一般部署在恶劣的环境中,节点易受到各