论文部分内容阅读
互联网的飞速发展早已解决了用户在信息获取上的困难,然而“物极必反”,互联网上的信息量早已超出了用户的需求。这些信息中,夹杂了大量用户所不需要的信息,从而产生了“信息过剩”的问题。针对这一问题,最早出现的解决方案是信息检索系统,其典型的代表就是搜索引擎。但是搜索引擎最大的问题在与缺少上下文信息,因此无法产生“千人千面”的个性化结果,而且要求用户提供准确的检索需求。而个性化的推荐系统的出现,则很好地弥补了搜索引擎的这一短板。推荐系统最早使用于电商平台,电商平台能够收集大量的用户相关数据,推荐系统通过对这些相关数据的挖掘,就可以获取用户的兴趣和需求,做到真正意义上的“投其所好”。对于电商来说,“投其所好”的意义会直接反映在经济效益上。近些年,正是由于这种利益的驱动,使得推荐系统发展十分迅速。然而个性化推荐推荐,也并非是完美无缺的。近年来,其局限性也逐渐被显现出来。现实中,许多日常活动是由多个用户以群组的形式参与的,因此,本文将研究方向转向了面向群组的推荐系统,充分利用用户之间的群组关系,侧重于考虑群组偏好进行推荐。关于群组的概念,目前大致可分为两种,一种是根据用户自然真实的社会关系而形成的社会化网络群组,而另一种是通过挖掘用户潜在的属性等,根据用户属性的相似度划分出来的群组。针对以上两种不同类型的群组,本文主要进行了以下内容的研究:1.对基于位置的社会化网络中的社交网络进行了研究,提出了一种能够有效利用基于位置社会化网络中用户的签到信息、社交群组关系,签到地点的位置信息的POI(point-of-interests)推荐算法,并将其并行化实现。2.针对没有显式群组关系的用户,利用与用户相关的物品的文本信息以及用户的历史评分记录,设计了一种基于内容的群组推荐算法,利用LDA(LatentDirichletAllocation)主题模型,将用户根据其相关的文本信息进行基于内容的分组,并利用LFM(Latent Factor Model)隐语义模型结合群组与内容的匹配度,预测群组用户对于物品的评分。3.以LGM(Latent Group Model)算法为基础,对该算法进行了并行化改进,提出了 PLGM(Parallel Latent Group Model),提出了在 Spark分布式计算平台上的并行策略,实现了算法的并行化,极大地提高了算法的可扩展性以及计算能力,从而提高了算法的实用价值。4.设计并实现了针对不同推荐场景的推荐原型系统,完成了系统前台及后台的开发,集成了上述的多种推荐算法,为用户提供了友好的可视化的算法展示操作平台,还原了真实的推荐场景。