论文部分内容阅读
随着电子商务等互联网服务系统的不断发展,越来越多的用户数据、项目数据以及用户与项目之间的交互数据积累在其中。这些海量多样的数据使得用户浪费大量的时间去选择和过滤产品。此时个性化推荐系统就可以解决此类的数据膨胀问题,它可以利用这些基础数据,通过使用数据挖掘和人工智能等技术,挖掘出用户的兴趣爱好和偏向,向用户推荐与兴趣相符的商品和服务,从而提高用户体验并给企业带来更多的经济效益。
本文首先分析了基于内容和基于协同过滤的推荐算法的优缺点,并在此基础上对传统的基于混合推荐方法进行改进。首先利用用户与项目之间的评分信息和特征信息来优化项目间的相似度计算;然后在用户和项目的全局关系下构建了一个用户与项目的加权两层图模型,并使用随机游走算法完成个性化的项目推荐和用户推荐。该算法相比其他推荐方法,考虑了项目本身的特征信息,并在全局关系下更全面的计算用户项目之间的相似性。实验结果表明,它具有更高的准确度。
个性化推荐系统研究本质由算法和系统两部分组成。随着越来越多大型的电子商务系统企业被推荐系统所吸引,大数据和实时计算问题也日益成为推荐系统的研究重点。本文首先对推荐系统的两个技术瓶颈问题:计算有效性和实时性进行了分析;然后借助软件设计的思想,把系统分为Web前端、离线计算和实时计算等几个模块,并分别进行了分析;最后,通过引入Hadoop、Storm、RabbitMQ和Redis等多种最新的开源技术,设计了一个完整的个性化推荐系统的构建方案。在该方案中,我们针对大数据的离线计算和实时计算提出了自己的实现思路,并针对模块之间的通信引入了基于消息队列的模块通信的方式,使得系统在处理能力和实时性上都得到保证,最后采用LAMP、JAVA等多个开发技术实现了系统的RC版。