论文部分内容阅读
推荐系统是互联网高速发展的产物,在人们的生活、工作及学习中发挥着非常重要的作用。现如今,推荐系统已经在电商、电影、社交等领域获得飞速发展,国内外针对推荐系统的应用研究一直是近年的研究热点。推荐算法及其所依赖的大数据是推荐系统的核心,基于SVD的推荐技术可以针对推荐系统中用户-项目二元评分数据以及用户-项目-标签三元权值数据进行研究,是目前可以同时针对两种数据进行处理的关键且有效的算法。但是随着待处理信息的数据量不断增大,算法计算效率和推荐准确性成为推荐系统研究的关键。本文针对SVD技术在推荐系统应用中出现的计算效率低和推荐准确性不太理想的问题,分别对低阶和高阶SVD推荐算法性能进行了深入研究,本文所做的主要工作如下:1.首先,将基于SVD基本算法改进的LFM、Bias SVD和SVD++推荐算法的性能进行研究。其中LFM是将高维评分矩阵分解成两个低维用户和项目特征矩阵,Bias SVD算法是在LFM的基础上将用户和项目的基准信息加入模型,SVD++算法则是在Bias SVD算法之上又考虑了隐式信息。论文通过理论及实验分别对三个模型的性能进行了比较,结果表明,SVD++算法的计算准确性最好,但是计算效率最低;LFM算法的计算效率最高,但是准确性最差。2.其次,针对SVD++算法计算复杂度偏高导致的计算效率低问题进行了深入研究。分析SVD++算法理论模型发现,对预测模型目标函数的训练采用梯度下降法开展时,所用学习率函数性能直接影响模型训练所用迭代次数及收敛速度,因此本文提出了一种新学习率函数来对SVD++预测模型的特征参数进行学习,改进的学习率函数具有初始值大、中期下降迅速及后期值小并且缓慢变化的特点,实验证明,此方法在采用梯度下降法对SVD++算法模型进行训练的前提下,既能使SVD++推荐算法的计算效率明显提高,又能保证预测准确性不变。3.最后,本文针对基于用户-项目-标签三元数据的HOSVD推荐算法进行研究。在推荐系统里,用户-项目-标签数据会经常出现标签冗余现象,若能充分利用该特点,寻找标签与标签之间的关联性,对进一步提高预测效率非常有益。为此,本文提出了一种基于Apriori算法重组标签的HOSVD推荐算法,首先采用Apriori算法对原始标签数据进行预处理,寻找标签频繁项集,设定为新标签,并对标签进行编号,组成新的用户-项目-标签数据,再利用HOSVD算法对新组成的数据进行计算处理。通过实验,本文方法的推荐性能有了明显提高。