论文部分内容阅读
随着移动计算飞速发展,为了方便用户使用智能移动设备和访问移动网络中的信息服务,app的数量急剧增长,如此海量的应用导致用户无法从这些海量应用中快速地选择出满足自己需求和符合自己潜在兴趣的app。为了解决这一难题,各个应用市场将个性化推荐系统应用于自己的应用商场,主动为用户推荐符合用户的潜在兴趣的app,因此,app推荐系统已经成为当前研究普遍关注的热点问题。协同过滤是app推荐系统的主要推荐算法,但传统的协同过滤算法存在评分数据稀疏问题,针对该问题,本课题设计并实现了一种基于用户行为的app推荐系统,其主要工作如下:(1)研究了基于评分的协同过滤算法,主要包括基于内存的协同过滤和基于模型的协同过滤算法。实现了基于用户的协同过滤、基于项目的协同过滤、基于正则化的奇异值分解的协同过滤。并结合实验数据,从准确率、召回率、F1值、SSD这四个评价指标对这三种算法进行评估。(2)针对评分数据稀疏问题,本文对以上基于评分的协同过滤进行改进。提出了一种基于用户行为序列的协同过滤,将更为丰富的行为日志数据作为协同过过滤算法的输入数据。通过数据预处理构造用户行为序列,并提出了基于行为序列的相似度计算方法。结合实验数据将该改进算法与基于评分的三种协同过滤算法在准确率、召回率、F1值、SSD这四个评价指标上进行比较。(3)针对用户的兴趣会随着时间的推荐而发生变化等问题,本课题对基于用户行为序列的协同过滤进行进一步改进,提出一种基于用户行为序列和时间衰减的协同过滤。考虑不同时间的数据对用户的影响不同,提出一种各个行为序列基于时间的权重的计算方法,并将该算法与基于用户行为序列的协同过滤在准确率、召回率、F1值、SSD这四个评价指标上进行对比。(4)设计并实现了一种基于用户行为的app推荐系统,该系统包含数据采集模块、数据预处理模块、app推荐模块。其中,在数据采集过程中,涉及到移动端的数据爬取,而在app推荐模块使用了基于用户行为和时间衰减的协同过滤算法为用户推荐app。通过初步使用本系统,将时间跨度为2017-08-08至2018-01-09的用户行为数据和app文本数据作为系统输入数据,选择其中的1000个用户以及与这些用户有交互的5281个app(这些用户的评分数据稀疏,而行为日志数据较丰富),为这1000个用户推荐app,推荐的结果满足了针对于评分数据稀疏的用户的个性化的推荐效果。