论文部分内容阅读
随着互联网技术的快速发展,海量、异质的数据信息呈指数级增长。各种信息对象在不同层次、不同维度,以不同方式互相影响,从而组成了复杂的网络。用户很难从这些海量信息中快速找到有价值的信息,信息使用率下降,带来了信息超载问题。解决信息过量行之有效的方法之一是个性化推荐,但推荐系统同样面临着海量数据处理难的问题,面对数据规模的日益增加,推荐系统在存储信息、检索信息以及推荐过程等都面临的推荐时延长网络开销大等问题,仍然需要进一步改进。 针对个性化推荐技术在面临海量数据处理和计算时可拓展性不高的问题,本文利用基于二部图的算法进行个性化推荐,提出了一种基于Chord环云服务推荐模型;并通过分析推荐系统在大规模数据处理面临挑战的基础上,提出将推荐系统与云计算平台结合起来,根据算法改进原则设计了云计算环境下的个性化推荐算法。主要研究工作包括以下几个方面: 1.分析了现有的个性化推荐技术,全面系统的阐述了现有研究进展,介绍了目前个性化推荐中存在的主要问题,讨论当前相关技术的研究方法。 2.深入介绍分布式计算系统中文件管理系统以及Map-Reduce工作机制,通过分析现有推荐系统所面临海量数据带来的挑战,表明推荐系统向云计算环境转移的必要性,而可行性则是通过资源交付方式、数据存储能力和数据处理能力这三个方面进行阐述。 3.针对传统二部图推荐算法中只是平均分配资源而没有考虑项目和用户的边权所导致推荐精度下降这一问题,在原有二部图推荐算法基础上提出了一种加权二部图推荐算法,该算法按照用户和项目之间边的权重分配资源,显著提高了个性化推荐系统的推荐精度和推荐质量。 4.针对个性化推荐技术处理和计算海量数据时出现的推荐时延长、网络开销大等问题,提出了一种基于Chord环云服务推荐模型,该模型首先基于面向云服务的推荐模型中引入 Chord环,分类筛选对推荐过程中影响较大的服务元集合,保证推荐系统快速检索候选服务集;然后将改进的算法 Map-Reduce化后部署到云计算平台上运行,并对云计算平台下的个性化推荐系统和现有的个性化推荐系统进行对比。通过单线程运行环境和云计算运行环境的有效比、加速比以及可拓展性等方面分析表明,云计算平台在推荐实时性方面大大优于单线程平台。