论文部分内容阅读
互联网发展得越来越快,在线获取最新消息已经成为几乎每个互联网用户每一条都在做的事情。海量的数据也造成了严重的消息过载问题,所以用于获取信息的网站上,消息的推荐系统具有重要的学术研究意义与商业应用价值。而对于微博类网站来说,最重要的数据类型主要为社交信息、时间信息两点。因此,基于社交信息跟时间信息的推荐系统结合了应用场景本身固有的特点,有很强的研究价值与广阔的应用前景。 本文在微博数据的分析上,广泛地调研了国内外的研究进展,深入研究了协同过滤算法的相关技术,并针对现有方法的不足,探索了结合微博数据的模型改进,主要的工作如下: (1)在对微博类网站的应用场景的分析下,在已有的单词层面做微博推荐的模型上,做出了模型改进,提高了一定的模型预测精度。 (2)利用微博的社交关系的特点,结合用户在微博上面兴趣有多面性的特点,提出了新的对每一个用户的喜好把对应的社交网络分块的方法,并依此提出了基于社交局部性的微博推荐模型。 (3)利用微博的社交性媒体的特点,结合微博的媒体性与信息随着时间衰减的特点,提出了用时间区间来分割时间线的方法,并依此提出了基于时间局部性的微博推荐模型。 使用真实的微博数据集进行了实验,并对比了提出的算法与传统的模型的实验结果对比。实验结果表明,本文提出的模型优于传统的模型,证实了模型假设的合理性。