论文部分内容阅读
随着移动互联网的迅速发展和移动终端的普及,微信成为人们学习生活中不可或缺的社交软件。移动端的文章推荐软件不断涌现,推荐效果不尽相同。在文章推荐领域,协同过滤推荐算法与基于内容的推荐算法是使用最广泛的两种推荐算法。由于协同过滤推荐算法存在数据稀疏性和冷启动问题,而基于内容的推荐算法又有过度规范问题,即不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源,缺乏新颖性,因此本论文通过结合协同过滤推荐算法和基于内容的推荐算法,采用加权混合的方式提出一种基于混合过滤技术的文章推荐算法,在此过程中,本论文展开了如下工作: 针对协同过滤推荐算法因数据稀疏导致推荐准确率不高的问题,提出一种混合协同过滤推荐算法,该算法结合基于用户的协同过滤算法和基于物品的协同过滤算法,采用改进的皮尔逊相关系数相似度计算方法来获取用户的最近邻居,然后通过对稀疏评分矩阵的二次填充来对项目进行评分预测。实验结果表明本算法比传统协同过滤算法有更好的效果。 针对公众号推荐文章问题,提出了基于协同过滤推荐算法和基于内容推荐算法的混合推荐算法,算法分为三步: 1、使用基于内容的推荐算法,利用Python与Scrapy爬虫框架获取微信公众号发布的所有文章,通过分析指定微信公众号发布的所有热门文章,提取热门文章关键词进行词频统计,将微信公众号文本内容向量化,再使用文本相似度算法从文章库中选出与指定微信公众号热门文章主题相似度排名靠前的文章进行推荐; 2、使用协同过滤推荐算法,在微信公众号-文章矩阵基础上,使用基于用户协同过滤技术,计算得到与指定微信公众号特征相似度靠前的微信公众号列表; 3、将基于内容推荐算法得到的推荐文章列表与协同过滤推荐算法得到相似公众号列表进行加权混合推荐形成最终推荐列表。通过实验证明,本论文设计的基于微信公众号平台混合推荐的文章推荐系统最终推荐结果比随机抽取微信公众号热门文章进行推荐的准确度更高,与单纯的基于内容的推荐算法相比,能有效提高推荐新颖度,本论文改进的混合推荐算法在微信公众号推荐上达到了预期结果。