论文部分内容阅读
随着互联网时代的来临,以及电子阅读的崛起,传统的纸质阅读形式受到了前所未有的冲击。如何为学校师生提供优质的服务关系到图书馆的生存和发展。学校图书馆是一所学校的灵魂,是重要的知识库,理解读者的图书借阅行为模式,并为读者推荐合适的图书,已成为当今所有学校图书馆的关注点。把数据挖掘技术运用到图书馆领域可以实现图书推荐功能,对图书馆工作的发展起到推动的作用。数据挖掘技术可以为了解读者的阅读需求和借阅行为提供重要的技术手段。本文以上海某职业院校图书馆2015年的图书借阅记录数据为例,综合运用数据挖掘,程序开发,图书馆学,市场管理学等多领域的知识对读者的借阅行为进行研究。针对学校图书馆领域中存在的读者借阅行为差异性大的问题,本文利用划分读者群体的方法,先用K-means算法对读者进行聚簇,将读者分为不同的读者群体,打上不同的特征值。这样能根据不同读者的特征值选择不同的数据挖掘策略,避免了读者借阅记录差异性带来的对数据挖掘结果的干扰。学校图书馆中存在许多读者借阅行为不活跃的现象,这些读者借阅记录会导致数据挖掘工作无法进行,本文采用将这些读者作为一个整体模型来考虑,使用创新的基于图书分类法矩阵的Apriori算法模型,即BBCMA算法(Based on Book Classification Matrix Apriori)对借阅行为不活跃的读者群体进行关联规则挖掘,发现不同图书类别之间借阅的内在关联性,并比较了传统Apriori算法和BBCMA算法的效率。这种算法能解决稀疏矩阵的问题,有效地利用一直以来被忽视的借阅量稀少的读者借阅记录。针对借阅行为活跃的读者群体,本文提出一种改进的基于图书分类法的协同过滤算法,即BBCCF算法(Based on Book Classification Collaborative Filtering algorithm)对其建立图书推荐的模型,利用余弦相似度计算邻居矩阵,并选择邻居值最大的读者所借阅的图书类型作为图书推荐的根据。这样可以解决传统协同过滤算法中评分矩阵过大的问题。最后根据数据挖掘的结果和改进的协同过滤算法,本文设计了创新的混合式图书推荐规则算法,并建立了基于读者借阅行为的图书推荐模块,可根据读者不同的借阅行为为读者提供读者个性化借阅服务。并通过实验论证了图书推荐模块的功能和效率。