论文部分内容阅读
在网民覆盖率日益攀高的今天,互联网俨然成为了一个大型的信息交互平台,人们每天都在互联网上不断地创造和分享信息,随之而来的“信息过载”问题也越来越严重:如何从纷繁复杂的信息中找到感兴趣的信息?人们熟知的搜索引擎如Baidu、Google等对于用户主动且明确的需求给予了很好的支持,然而很多时候用户的需求是模糊和被动的,此时的搜索引擎不再能满足人们的需求。个性化推荐系统在对用户历史行为数据进行分析的基础上,利用相关推荐技术对用户的需求和兴趣进行挖掘、对信息进行过滤和筛选,最后产生推荐。在用户需求是模糊和被动的情况下个性化推荐系统的作用显得更加有效。
推荐算法是个性化推荐系统的核心,随着大数据时代的来临,如何有效利用数据来改进推荐算法性能已经成为一个重要的研究领域。到目前为止,主流的推荐方法主要有基于协同过滤的推荐方法、基于内容的推荐方法和基于知识的推荐方法等,其中基于协同过滤的推荐方法是最为行之有效的,并大量应用于电子商务网站之中。尽管如此,和许多推荐方法一样,基于协同过滤的推荐方法依然面临着数据稀疏性问题、冷启动问题等亟待解决的问题。鉴于此,本文作了相关研究和分析,改进了协同过滤算法性能,并从一定程度上缓解了数据稀疏性问题,其主要工作内容和创新点如下:
1.研究和分析了现有的主流推荐算法,指出了各自的优势和不足,为后面算法的改进提供了理论基础。
2.对基于用户邻域的推荐算法进行研究,通过改变不同用户群体的权重因子、利用时间上下文信息和“惩罚”热门物品等方法改进了相似度模型以改进算法,并采用最小二乘法对算法进行融合。实验结果表明,和传统的利用皮尔森相似度的基于用户邻域的算法相比,改进和融合后的算法推荐精度有所提高。
3.对基于矩阵奇异值分解的推荐算法进行研究,通过利用时间上下文信息和引入相似度信息等方法对算法进行改进,并采用最小二乘法对算法进行融合。实验结果表明,改进和融合后的算法和传统的基于矩阵奇异值分解的方法相比算法精度有所提高。
4.针对数据稀疏性问题,通过把用户信任度引入基于随机游走的PersonalRank算法来改进算法。实验结果表明,和基于随机游走的PersonalRank算法相比,改进后的算法在有效缓解数据稀疏性问题的同时提高算法精度和算法稳定性。
推荐算法是个性化推荐系统的核心,随着大数据时代的来临,如何有效利用数据来改进推荐算法性能已经成为一个重要的研究领域。到目前为止,主流的推荐方法主要有基于协同过滤的推荐方法、基于内容的推荐方法和基于知识的推荐方法等,其中基于协同过滤的推荐方法是最为行之有效的,并大量应用于电子商务网站之中。尽管如此,和许多推荐方法一样,基于协同过滤的推荐方法依然面临着数据稀疏性问题、冷启动问题等亟待解决的问题。鉴于此,本文作了相关研究和分析,改进了协同过滤算法性能,并从一定程度上缓解了数据稀疏性问题,其主要工作内容和创新点如下:
1.研究和分析了现有的主流推荐算法,指出了各自的优势和不足,为后面算法的改进提供了理论基础。
2.对基于用户邻域的推荐算法进行研究,通过改变不同用户群体的权重因子、利用时间上下文信息和“惩罚”热门物品等方法改进了相似度模型以改进算法,并采用最小二乘法对算法进行融合。实验结果表明,和传统的利用皮尔森相似度的基于用户邻域的算法相比,改进和融合后的算法推荐精度有所提高。
3.对基于矩阵奇异值分解的推荐算法进行研究,通过利用时间上下文信息和引入相似度信息等方法对算法进行改进,并采用最小二乘法对算法进行融合。实验结果表明,改进和融合后的算法和传统的基于矩阵奇异值分解的方法相比算法精度有所提高。
4.针对数据稀疏性问题,通过把用户信任度引入基于随机游走的PersonalRank算法来改进算法。实验结果表明,和基于随机游走的PersonalRank算法相比,改进后的算法在有效缓解数据稀疏性问题的同时提高算法精度和算法稳定性。