论文部分内容阅读
随着互联网信息的爆炸增长,互联网平台越来越依赖推荐系统对用户进行商品推荐。推荐系统可以帮助平台从海量信息中筛选出合适的内容,推送给用户,一方面帮助商家捕捉用户兴趣,另一方面也能满足用户个性化需求。推荐算法是推荐系统中的核心技术,研究推荐算法研究对于促进推荐系统在互联网平台中的有效应用具有重要意义。本文针对点击率预测推荐和排序学习推荐两个推荐场景中存在的问题,分别提出了新的点击率预测推荐模型和排序学习推荐算法。具体研究内容如下:(1)针对点击率预测推荐场景中已有推荐模型难以同时满足记忆与泛化功能、不能充分挖掘和组合低阶特征以及深度学习模型在推荐系统的高维稀疏数据集下模型参数难以学习且推荐结果过度泛化的问题,本文提出了一种基于梯度提升树和因子分解机的深度点击率预测模型,该模型结合了梯度提升树,因子分解机和深度神经网络,可同时实现记忆与泛化功能,可以充分挖掘低阶特征信息并自动实现低阶特征组合,可以在高维稀疏数据集上较好地学习模型参数,推荐结果也不再过度泛化。本文在大型竞赛平台数据集上进行了仿真实验,并对比了相关的点击率预测推荐模型。实验结果表明,本文所提模型在AUC(Area under ROC curve,受试者测试曲线下面积)评价指标与交叉熵评价指标上都取得了更好的效果。(2)针对排序学习推荐场景中NDCG(Normalize Discounted cumulative gain,归一化折扣累计收益)评价指标不能直接作为排序学习的损失函数,导致排序模型的学习目标与评价指标不一致的问题,本文提出了一种基于近似函数的排序学习推荐算法,该算法可以直接优化NDCG评价指标,确保了排序模型学习目标与评价指标的一致性。本文在国际公开数据集上进行了仿真实验,并对比了相关排序学习算法。实验结果表明,在NDCG评价指标上,本文所提算法取得了更好的评价效果。