论文部分内容阅读
推荐系统是现代信息系统的重要组成部分,一直是机器学习、信息检索等领域的研究热点。随着Web2.0技术的发展,社会标签系统因其具有共享性、描述性和互动性等特点而得到广泛应用。与传统系统的推荐应用相比,社会标签系统中既可以使用社会标签又可以使用评分信息进行推荐,从而大大提高了推荐结果的可解释性和精确性,但是基于社会标签系统的推荐技术尚处在发展的初级阶段,传统的推荐方法在社会标签系统的新背景下存在一定的局限性,主要体现在:(1)无法有效地在社会标签系统范围内根据社会标签和评分信息感知用户兴趣的变化;(2)无法有效地利用社会标签系统的社会性特征和用户兴趣主题的多粒度性精确发现用户兴趣社区;(3)无法有效地将社会标签与评分信息融合并进行个性化推荐。本文以提高社会标签系统中个性化推荐的质量为目标,使用主题模型、状态空间模型和矩阵分解等相关理论与方法,研究了社会标签系统环境下个性化推荐问题,目的在于进一步丰富和完善基于社会标签系统的个性化推荐理论与方法,增强个性化推荐算法的实用性和灵活性。具体地,本文开展以下几个部分的研究:(1)用户兴趣漂移感知方法研究。针对目前社会标签系统中在时间上不加区分地将全部训练数据作为整体进行计算、忽略用户兴趣漂移的问题,提出基于动态主题模型的用户兴趣主题漂移感知方法和基于状态空间模型与概率矩阵分解融合的用户兴趣程度漂移感知方法。所提出的方法有效地利用社会标签和评分信息识别用户兴趣主题和用户兴趣程度的生命周期,从而能够有效获取用户兴趣的周期性特征。(2)多粒度兴趣社区发现方法研究。针对目前社会标签系统中用户兴趣社区发现不考虑兴趣主题和标签属性主题之间的差异,导致无法有效发现用户兴趣社区的问题,提出基于非负矩阵分解和非线性矩阵分解的多粒度兴趣社区发现方法。所提出的方法能够根据用户标注的社会标签有效区分用户兴趣主题的粒度,从而能够从用户兴趣主题和标签属性的多粒度级别进行兴趣社区的发现与识别。(3)社会标签与评分信息融合的个性化推荐方法研究。针对目前社会标签系统中推荐方法没有有效融合社会标签与评分信息的问题,从用户兴趣主题级别和标签属性级别的角度分别提出基于潜在狄利克雷分配与概率矩阵分解融合的推荐算法和基于联合概率矩阵分解的推荐算法。所提出的算法有效地将体现用户兴趣主题的社会标签与体现用户喜好程度的评分信息进行融合,从而能够有效解决评分信息语义不明和评分与项目属性匹配问题。(4)在本文提出的理论和方法的基础上,设计并实现了一个应用于在线商品销售的个性化推荐系统,实现了本文提出的各种算法,该部分数据分析功能在结构上独立于业务模块,具有较好的可移植性和可维护性。