论文部分内容阅读
随着互联网和信息技术的飞速发展,网络产品和互联网用户数量也在快速增长,这将人们从之前的信息匮乏时期带入了现在的“信息过载”和“信息爆炸”的时代。与此同时,各种社会化媒体也在人们的日常生活中得到了广泛应用,并产生大量数据。面对这些海量的数据与信息,用户如何快速的找到自己需要的信息或者物品就成为了一个迫切的问题。因此,推荐系统就成为了各种电子商务、零售企业和网络销售等互联网服务用来减轻用户筛选信息负担的重要技术。通常,推荐系统通过收集和分析用户一段时间内的历史行为,对用户的兴趣爱好建模,从而预测出用户对于其他物品的偏好程度,继而进行个性化的推荐。但推荐算法领域中依然存在一些瓶颈问题需要解决。本文基于多目标进化优化的思想,针对推荐算法过程中各类因素的影响,以及推荐结果不同指标之间的权衡问题进行了探索和研究。主要研究工作和创新点如下:(1)在传统的推荐算法中,更多的是考虑提高推荐结果的准确度,但仅仅考虑准确度可能不足以向用户推荐出满意的物品。推荐系统其他的性能指标,比如多样性,在产生推荐结果时也应该考虑到。所以从用户体验感角度出发,好的推荐系统要同时兼顾准确率和多样性。对此本文提出了一种易于实现的基于多目标免疫优化的推荐算法框架,它能在不降低准确度的前提下,为用户生成具有良好多样性和新颖度的推荐列表。这个方法的核心思想是将协同过滤技术与多目标进化算法相结合,构建一个基于先级联后并行式的混合框架。不同于现有的推荐算法,这种新框架将推荐系统的任务看成是一个多目标优化问题,目的是解决推荐结果中准确度与多样性之间权衡的困境。首先,利用协同过滤算法为后续步骤生成候选解。然后使用非支配邻域免疫算法,同时最大化匹配函数和多样性函数,在候选数据集中进行全局搜索。算法针对当前活跃用户生成一组Pareto解集分别代表一组推荐列表。实验结果表明,这种算法在解决推荐结果准确度-多样性的困境是有效的,它可以向用户推荐比传统方法更加多样化和新颖的物品。(2)借鉴上一工作的优化思想,针对个性化电影推荐,提出了一种基于并行式混合设计思想的推荐模型。在该模型中,电影推荐问题被构建为一个多目标优化问题,用来解决电影推荐中准确度和新颖性矛盾的问题。鉴于在离线训练时无法得知推荐结果实际的准确度,所以在训练阶段采用二部图概率传播的算法计算出用户未评价电影的预测评分,作为准确度的评估构建成第一个目标函数,以推荐结果新颖性作为第二个目标函数。算法将多个用户的推荐结果编码在一个个体中,运行一次可以得到所有用户的多组推荐列表。设计了符合要求的交叉变异算子,使得进化有效的进行。为了降低算法的时间复杂度,首先将用户根据相似度进行聚类,使得对电影评分相似的用户在同一聚类簇内,然后在每个聚类簇中运行算法。本章算法的目的是为用户推荐自己以前并不熟知的新颖的电影,而又不能完全偏离用户以往的观影偏好。最后通过在MovieLens电影数据集上大量实验,验证了本章算法能够有效的平衡推荐结果的准确率和新颖性之间的矛盾关系,为用户产生感兴趣但非流行的电影推荐列表。(3)针对上一工作中Pareto前沿面收敛速度偏慢,算法迭代次数多的缺点,设计了一个更适合实数编码环境下解决多目标个性化电影推荐的概率交叉遗传算子。它通过多父代概率遗传,将系统多次推荐的电影编码更大概率的遗传给子代个体。新的交叉遗传算子更符合用户使用推荐系统时的用户选择特性。实验结果表明,这种算法不仅能够为用户提供满意的推荐列表,而且与上一章算法相比,迭代次数减少,收敛速度加快。(4)社会化媒体可以融合线上数据和线下人们的活动,使得互联网更真实化,从而得到了广泛应用。在基于位置的社交网络中,位置推荐问题不仅要考虑用户的线上行为(比如签到行为、点击行为、点评行为等)和用户在社交网络中的好友影响力,还要考虑线下用户行为受地理位置因素的影响。对此,本文为个性化位置推荐系统提出了一种新策略去探索在基于位置的社交网络中用户潜在的感兴趣的地点,用来克服传统并行加权式位置推荐算法中需要大量实验确定加权系数的缺点。在本文框架中个性化的位置推荐需要考虑的不同因素被构建成不同的目标函数,用多目标进化方法同时优化用户线上签到行为所构成的匹配函数和线下用户在访问地点是受地理因素影响的核密度函数,从而避免了大量调整权重系数的过程。本文还利用了用户线上的社交信息,缩小了当前用户的搜索空间,提高了算法的及时性。为了证明本框架的有效性,本章使用网站Gowalla和Brightkite的部分真实数据集进行了实验。实验结果表明,该算法可以为每个用户提供个性化的位置推荐,具有良好的应用前景。