论文部分内容阅读
随着网络的发展,信息的海量增加,人们用传统的信息检索技术,要在其中查找并筛选出符合自己兴趣的信息变得越来越困难。协同过滤推荐技术由于内容无关性等优势,在很多领域都得到应用,并在电子商务领域取得初步的成功。然而目前,在高校图书馆领域运用推荐技术的案例并不多,并且大部分都是使用基于内容的推荐算法或是混合的推荐算法,单纯使用协同过滤推荐算法应用在高校图书馆领域的案例在国内并不多见。由于高校图书馆的藏书和读者相对专业,加上新兴专业层出不穷,专业不断融合,知识膨胀日益加速,对于高校师生来讲,要从海量藏书中找到适合自己的图书并不是一件容易的事情。因此,为高校图书馆领域构建推荐系统变得十分必要。为了帮助师生更方便准确地找到自己感兴趣的图书,节省读者检索图书的时间,本文提出了在高校图书馆领域内运用协同过滤推荐算法来构建推荐系统.通过基于华侨大学500百万条用户真实的日志数据的实验和分析,我们不但对建设的必要性做了定性和定量的分析,还对不同的算法进行了比较,并选出合适的方案。本文的仿真实验还发现基于学院(局部)的借阅数据所构建的模型可以为用户提供与基于全校(全局)的借阅数据所训练的模型相近的精度,这个发现不但反映了高校图书馆用户的行为特点——专业和专注,更可视为降低计算复杂度的直接依据——我们因此将(1)节省可观的计算资源,(2)能够及时响应新的用户数据并更新模型,(3)可根据不同学院的新数据产生速度来定制不同的更新策略。通过基于真实数据的实验验证,本文发现了基于局部数据构建推荐模型的可行性和有效性,这是协同过滤技术在高校图书馆这一特定应用环境里的新发现,对同行有一定的参考价值。同时,本文将这种利用局部数据来为用户推荐的思想运用到实际的图书馆推荐系统中,设计并实现了一个基于高校图书馆领域的图书推荐系统原型。系统不但实现了推荐功能,同时也通过其他辅助功能来改善协同过滤技术所固有的冷启动问题。