论文部分内容阅读
协同过滤算法如今已经广泛地应用在推荐系统领域,并很好地处理了爆炸式的信息过载问题。但是随着数据问题的复杂化,比如潜在的隐式数据特征难以捕获、数据集的稀疏性越来越高以及数据的时效性存在变化等问题使传统协同过滤算法推荐的准确性到达了相对的瓶颈期。而融合了动态时序特性的矩阵因子分解模型以及DNNs(深度神经网络)模型对于解决推荐系统领域中模拟时效性变化和数据隐式反馈等问题有着重要的研究价值。本文以含有动态时序属性的电影评分数据集为研究对象,对给定的目标用户给出符合其喜好的推荐结果。为了便于推荐模型在分析阶段的使用,首先对数据集进行预处理。利用PCA(主成分分析)选取一部分核心数据进行预先分析,根据分析结果对数据集进行数据归一化以及减噪处理。再利用基于密度峰值的聚类方法对初步处理后的数据集进行聚类处理,隔离特殊样本后,得到相似的用户簇和电影簇的划分。根据传统协同过滤算法所面临的瓶颈问题,本文提出并设计了一种基于动态时序的矩阵因子分解模型,主要由静态信息捕捉模型和含有动态时序因子的动态模型组成,模拟了用户偏好随着时间的连续变化趋势和电影流行度随着时间段的离散变化趋势。由于模型的矩阵分解方法具有一定局限性,在解决用户和电影之间的复杂交互问题中依然存在瓶颈。通过研究以及实验的对比分析,根据深度神经网络的思想来模拟数据中存在的隐式的交互,以完善其中的不足。本文在复合矩阵因子分解模型基础上设计深度协同过滤总框架,并使用MLP(多层感知器)模块来模拟用户和电影项目之间存在的难以捕捉的隐式交互,并融合矩阵分解,综合得到推荐结果,采用RMSE(均方根误差)对提出的推荐方法在实验数据集上的推荐结果进行综合分析和评价。通过与主流推荐方法在实验数据上得到的推荐结果进行横向对比,结果表明基于动态时序的复合协同过滤模型对于推荐结果准确性的提高有一定作用。