论文部分内容阅读
近年来,随着科学技术的不断更新和人类文明的快速跃升,各方面的理论、知识和技术一直在迅猛发展,我们生活在信息和知识的海洋里。作为信息和知识集散中心的图书馆在人们生活和工作中的地位愈发重要。随着网络技术、通信技术、数字化存储技术、可视化技术、人工智能技术等的不断发展,各种数字资源日益丰富,基于数字资源的数字图书馆已成为未来图书馆发展的必然趋势。然而,尽管数字图书馆的发展如火如荼,受限于各种软硬件技术的发展水平,以及人类的生理、心理和生活习惯等因素的制约,纸本图书仍将在相当长的时期内占据优势地位。数字图书馆与传统图书馆经过妥协与融合,同时提供数字图书与纸本图书的过渡形态,在相当长的时期内将会是数字图书馆存在的主流形态。随着图书资源数量的急剧增加、人们生活节奏和知识更新速度的不断加快,如何使用户在浩瀚的图书资源中快速、准确地找到感兴趣的内容,已经成为图书馆学专家和学者面临的迫切课题之一,也是现代图书馆生存和发展无法回避的问题。数据挖掘技术的出现客观上为数字图书馆的个性化推荐提供了一个解决思路。本文以数字图书馆的个性化推荐为研究目标,结合本体、概念格、关联规则、信息推荐等新兴技术,研究和分析数字图书馆的个性化推荐过程中所涉及到的用户建模、图书推荐、图书配置等的理论和实现,提供了一个完整的解决方案,并用原型系统予以验证。本文的研究内容主要包括以下几个方面:(1)数字图书馆的用户偏好模型基于中国图书馆分类法(中图法)规范建立图书分类的本体结构,对于分类不够细致的中图法类目,通过概念格聚类生成新的更为细致的类目,作为对中图法规范的补充。根据所建立的中图法本体建立用于个性化推荐的用户偏好模型。鉴于中图法本体在一些跨学科图书描述上的不足,给出了基于向量空间模型的用户偏好模型。两个用户偏好模型共同描述了用户的偏好特征。同时,对用户偏好模型的一些运算和群特征进行了研究。(2)直接基于用户偏好模型的图书推荐策略通过计算目标图书所在中图法类目与中图法本体各概念的语义相似度,获取“最近邻居”,并通过对“最近邻居”的评分值(用户借阅频次)加权求和的方式,预测用户对目标图书可能的感兴趣程度。(3)基于偏好模型相似度的图书协同推荐策略基于用户偏好模型的相似度,找到与目标用户的兴趣偏好比较接近的用户作为“最近邻居”,并采用协同推荐的策略通过“最近邻居”对目标图书的效用度估计值,预测目标用户对该图书的感兴趣程度。(4)基于偏好模型的图书配置策略针对图书在图书分馆之间的配置比例普遍存在的不合理现象,研究了入库新书在各分馆之间的合理配置比例的预测方法。(5)基于用户的图书协同推荐策略从关联规则的角度估算用户之间的相似度,从而找出目标用户的“最近邻居”,并根据“最近邻居”对目标图书的借阅情况,预测目标用户对目标图书的感兴趣程度。(6)概念格在图书协同推荐中的应用通过分析现有文献提出的概念格在协同推荐中的应用原理和方法,结合数字图书馆的服务特征,将概念格引入到数字图书馆的个性化推荐中,从而加快协同推荐中“最近邻居”的查找速度,提高协同推荐的计算效率。(7)原型系统给出了原型系统,对文中提出的理论和算法予以验证。