论文部分内容阅读
随着社交网络的飞速发展,人们在海量数据中很难快速获取想要的数据信息,逐渐形成信息过载问题,企业和科研机构为此进行大量的研究和实践工作,最终推荐系统应运而生。推荐系统能够根据用户的兴趣爱好、历史行为等信息为其提供个性化信息推荐服务,逐渐在电商、教学、政企等领域发挥重要作用,成为一个热门研究方向。虽然推荐系统拥有诸多的成果和优势,但是随着社交网络数据的快速增长,传统的推荐算法已无法满足用户精确的推荐需求,尤其稀疏性、冷启动等问题导致推荐准确度的下降一直未被很好的解决。同时在社交网络中信息量的过大,导致信任网络间相似性的计算更加的困难,系统运行变得缓慢,推荐的准确度受到严重的影响,无法进行实时的个性化推荐,另外传统推荐算法只考虑用户间的直接社会关系,而忽略了用户潜在的兴趣偏好特征和社区聚类特征。针对上述情况,本文的研究内容如下:(1)通过将社交网络社区划分技术和协同过滤推荐算法相结合的方式,提出了一种基于改进COPRA社区划分的推荐算法CBRA。首先,针对用户相似矩阵,结合用户信任度,构建用户关系矩阵。接着使用改进后的COPRA算法对社交网络进行社区划分,形成用户最近邻居集合,有效缓解了数据稀疏性和冷启动问题。最后,利用社区中邻居用户评分对目标用户未打分的项目进行预测评分并生成TopN推荐列表。实验验证了该算法的推荐准确性和运行效率。(2)提出了一种融合用户特征聚类的协同过滤推荐算法PKM-UserCF。首先,利用Canopy聚类算法和Max-Mindistance算法改进经典聚类算法K-Medoids,将Canopy初步聚类的结果提供给K-Medoids作为初始K值的选定,这样避免了 K值选取的不确定性,接着采用Max-Mindistance算法优化聚类中心的选取,有效避免陷入局部最优解的问题。并针对大规模社交用户数据,采用MapReduce计算框架来对该算法实现并行化。其次结合用户的特征属性、兴趣偏好和相似度,将目标用户最近邻集合的选取由整个社交网络范围缩小为聚类簇群,然后基于用户协同过滤算法实现对目标用户的TopN推荐。实验验证算法的推荐准确性和运行效率。(3)本文利用Hadoop分布式框架,基于前述提出的推荐算法设计了一个个性化电影推荐系统。系统具有以下功能:①.系统可根据用户操作历史对用户进行电影推荐,用户也可以搜索任意想看的电影并为该电影打分;②.系统为用户提供热门电影的推送以及电影榜单的查询;③.系统具有社交网络特性,用户可以添加与自己兴趣相同的用户为好友,好友间可以相互分享、转发、点赞、评论各自动态;④.系统具有社区功能,在社区里面有许多兴趣相投的用户,用户可以加入自己感兴趣的社区,并拥有发帖、评论、点赞等功能。