论文部分内容阅读
随着微博用户数量的上升,微博信息量成倍增长,基于冗杂的微博信息向微博用户快速推荐感兴趣的好友是不容回避的技术问题。针对这一问题,基于微博大数据,以Hadoop为平台,HBase为基础,MapReduce为编程框架,提出了基于Apriori算法与Item—based协同过滤算法的组合算法,并构建了推荐好友系统。该系统通过Apriori算法对冗杂的微博内容记录进行频繁项集的计算,得出能表达用户喜好的标签,以提升系统的时间性能;通过Item—based算法对标签进行匹配推荐,以缩短系统的推荐时间以及资源占用率。