论文部分内容阅读
微博是目前最热门的互联网应用之一,吸引了数以亿计的用户。通过微博系统用户可以自由地关注感兴趣的人,同时发布、分享、评论感兴趣的信息。目前微博用户每天产生的微博总数超过一亿条,导致社交信息严重过载。推荐系统一直是社交网络研究领域的热点,其中的许多研究成果都已经应用于微博数据中,如用户好友推荐、微博标签推荐、新闻话题推荐,在某种程度上解决了社交信息过载问题。本文试图从用户兴趣圈子的角度为用户推荐热点微博,主要工作如下:
提出了一种融合边权重的改进GN算法,用于检测微博用户的兴趣社区。该算法(WGN)通过逐步删除割边将图分割成一个个独立的点,然后根据模块化指标Q确定最终社区划分。在计算机生成图、微博用户社交图和WebKB共引图上的实验结果表明:(1) WGN算法可以有效地检测出用户的兴趣社区;(2)融合边权重可以提高了社区检测的效果。
提出了一个基于潜在因素模型(LFM)融合显式特征和潜在特征的社区热点微博推荐算法(CWR)。该算法首先采用随机梯度下降方法在训练数据集上学习出用户对微博的评分模型,然后应用该模型计算测试数据中每个用户对每条微博的评分,最后根据社区中每条微博平均评分筛选出评分较高的社区热点微博推荐给用户。实验结果表明:(1)融合两种特征信息的推荐效果好于使用单一特征信息;(2)和基于转发次数的对照实验(WRR)相比,CWR推荐效果好于WRR;(3)通过分析算法推荐微博的内容发现CWR倾向于为用户推荐兴趣社区相关微博,WRR倾向于为用户推荐公共热点微博。
基于上述两种算法构建了一个实时的个性化微博信息推荐系统SIRMIR。该系统实时获取登录用户的微博社交关系图后检测出用户的兴趣社区,然后基于兴趣社区向用户推荐当日热点微博。