【摘 要】
:
在图书馆流通中,每天都产生大量的数据,怎样合理地利用这些信息为图书馆管理服务,是我们迫切需要研究的课题。目前的图书馆管理系统无法发现这些数据中存在的关系和规则,无法
论文部分内容阅读
在图书馆流通中,每天都产生大量的数据,怎样合理地利用这些信息为图书馆管理服务,是我们迫切需要研究的课题。目前的图书馆管理系统无法发现这些数据中存在的关系和规则,无法预测读者的信息需求,缺乏挖掘数据背后隐藏的知识的手段,读者很难找到所需要的信息资源。数据挖掘技术的兴起,为图书馆工作提供了很好的技术支持和决策管理支持。利用数据挖掘的方法,揭示这些数据背后所隐藏的关系。对图书馆的借阅历史记录进行数据挖掘和分析,为图书馆的资源建设及图书的学科结构等提供依据,使图书馆的被动服务变为主动服务,从而提高图书馆的服务质量。
本文研究的内容是把数据挖掘技术应用于图书馆读者管理。以“宝德学院图书馆自动化管理系统”中的历史借阅记录、读者信息及馆藏数据作为基本数据源,采用Microsoft SQL Server 2005作为数据挖掘工具,运用挖掘技术发现读者借阅特点。具体包括以下几个方面:
1、探讨了数据挖掘技术及其在图书馆中的应用。
2、对图书馆读者管理主题相关的图书馆数据库中的数据表进行数据预处理,以便于进行数据挖掘。
3、将读者借阅量作为数据源,运用决策树算法对读者的借阅量等级进行分类和预测。将读者借阅图书记录作为数据源,运用聚类算法划分读者群,分析其特征。将读者信息、借阅量和借阅图书作为数据源,运用关联分析挖掘读者的阅读兴趣。将图书日流通量和月流通量作为数据源,运用时间序列算法对流通量进行预测。
4、对以上四种算法的挖掘结果进行分析,将结论应用于图书馆读者管理;并讨论进一步工作。
其他文献
连续函数的总体极值在自然科学、人文科学和工程设计等各种学科中都有着很广泛的应用。目前对于求解函数局部极值有很多好的成熟实用算法,而对于求解函数总体极值尚不多见,因此
分布式约束优化是解决分布式推理任务的一个基本框架,是目前多Agent领域的研究热点。近几年来提出了许多优秀的分布式约束优化算法,这些算法大体上分为完备算法和非完备算法
随着数码设备的普及,互联网的兴起,每天将产生大量数字图像。为了有效的存储、管理图像数据库,需要对图像库进行索引,按特定的需求检索图像。怎么根据数字图像的视觉内容有效
随着信息技术与互联网技术的发展,大量的数据在各行各业中积累着,为了综合利用这些数据信息,达到充分的资源利用,需要针对现有的数据进行科学的研究和分析,进行大量的数据沉淀和数
分类技术是数据挖掘领域一项重要的任务。如何根据训练集建立分类器,并使用该分类器准确预测待测试实例的类别是衡量分类器好坏的标准。单级分类器通常只对训练集学习一次,在
对等网络(P2P)是一种采用分布式体系结构的网络,也是当今一个迅速发展的研究领域。现有的P2P系统网络规模大、动态性高、异构性强,有效的搜索技术一直是P2P系统研究中的核心问题,
有效的运动估计可以减少运动补偿残差帧中的能量,能够明显提高视频的压缩性能。本文系统分析了两种不同的运动估计方案:分级运动估计和变换域运动估计。运动补偿的嵌入式零块
Map Reduce作为一个并行处理的计算模型,因为其高容错性,高易用性,以及高扩展性在大规模分布式数据处理中得到广泛的应用。Map Reduce可以处理关系数据库中一些操作,像是选择
系统结构模型的构建是点对点技术的核心研究领域之一。全分布式结构化的系统把节点组织成一个具有良好的连接和路由规律的结构化拓扑来进行资源共享和查询。在结构化网络中,
随着计算机互联网的发展和广泛应用,网络安全问题变得越来越严重。因此,开展网络安全特别是入侵攻击与防范技术的研究,开发高效实用的入侵检测系统,对计算机网络的发展与应用