论文部分内容阅读
推荐系统,作为挖掘用户历史数据的重要工具之一,已经被广泛应用于商业化平台。然而在过去的研究中,人们关注的推荐系统性能绝大多数都集中于准确率,导致热门商品被大量堆砌在用户面前,整体推荐结果同质化严重,因此多样性也开始成为业界衡量推荐算法质量的重要评价指标之一。目前评估推荐列表或推荐系统多样性的方法大多集中于对项目之间或者列表之间的不相似度简单地求均值的过程,这样的评价方法不足以充分反映推荐(列表)系统多样性细节。与此同时,大部分推荐算法在推荐过程中,只考虑了评分信息,没有利用用户和项目的属性信息,而在利用评分进行推荐时,又只关心评分数值的大小,忽略了其在项目的所有用户评分中的排名。本文立足于推荐系统的多样性,针对列表级和系统级评价问题,提出了两种改进的方法及相应指标;针对属性信息和评分排名问题,提出了一种结合属性嵌入神经网络和二次排序的多样性优化推荐算法。本文的主要工作如下:(1)针对列表级评价中项目位置和流行度带来的影响,提出了结合归一化累积表现-位置因子积的多样性评价方法以及NCIP指标。NCIP指标吸收了新颖性指标和NDCG指标的思想,结合归一化项目流行度和推荐列表中的位置信息作为ILD指标中项目之间的不相似度的权重。通过将推荐列表的类别数作为多样性衡量标准,验证了 NCIP指标能够拟合不同推荐长度下推荐列表的类别数变化的曲线。(2)针对推荐系统中不同活跃度用户组的多样性需求差异,提出了结合多样性需求因子和准确率的多样性评价方法以及PD指标。PD指标利用归一化用户活跃度线性融合了 Precision指标和用户级汉明距离。通过将召回类别命中率作为多样性考量依据,验证了 PD指标能够预测不同活跃度组别下的召回类别命中率。(3)为了改善推荐算法的多样性,提出了结合属性嵌入神经网络和二次排序的多样性优化推荐算法,该算法分为属性嵌入神经网络推荐模型(EA-CNN)和二次排序(FBRR)两个部分。EA-CNN是由非结构化的标题属性和其他结构化属性相结合的卷积网络构成的。FBRR则是在EA-CNN生成推荐集合后引入了逆向推荐的思想,结合TOPSIS法对推荐集合在二维推荐空间中进行二次得分排序,重构推荐列表。通过与传统推荐算法对比,EA-CNN+FBRR推荐算法生成的推荐列表能够在Precision和HD指标基本不变的前提下,在Coverage、ILD、NCIP指标上分别至少提升 10.97%、8.88%、6.95%。