论文部分内容阅读
微博简短、即时、便捷的特性使其很快吸引了大量的用户群,并通过大量的转发及评论裂变式的快速传播与扩散,产生大量信息流。为了从海量信息中找出用户所感兴趣的微博话题,就需要设计合理的兴趣表示模型和准确高效的微博用户兴趣推荐方法。其中,微博用户兴趣模型是实现微博用户兴趣推荐的基础,微博用户兴趣推荐是微博用户兴趣模型的应用。因而,针对微博用户兴趣建模与推荐研究对于微博网站的发展十分重要。本文以构建微博用户兴趣模型及推荐方法作为研究背景,针对微博长度短、信息量少,高维稀疏等特点,研究用户兴趣信息获取、微博用户兴趣模型构建及推荐方法,旨在构建合理的微博用户兴趣模型及推荐方法,从而实现对微博用户准确高效的微博话题推荐。本文以新浪微博作为数据来源,主要做了如下工作:(1)分析微博中所包含的各种信息、微博用户行为及其和微博用户兴趣间的关系,选择合适的信息作为微博用户兴趣信息的来源,从而得到能够准确有效表示微博用户兴趣的信息。(2)提出了一种基于词项关联关系与归一化割加权非负矩阵分解的微博用户兴趣模型构建方法。该方法首先基于词分布上下文语义相关性来建立词项关联关系矩阵刻画词项间相似度,接着应用归一化割加权非负矩阵分解算法获取用户-主题矩阵,产生用户感兴趣的微博主题聚类结果。实验表明,此方法能有效地进行微博主题聚类,并支持微博用户兴趣模型构建。(3)提出了一种基于用户兴趣模型与会话抽取算法的微博推荐方法。该方法首先应用基于归一化割加权非负矩阵分解的微博用户兴趣模型获取用户-主题矩阵,产生用户感兴趣的微博主题,然后结合基于Single-Pass聚类模型的会话在线抽取算法SPFC(single-pass based on frequency and correlation)获取微博的会话队列并与用户感兴趣的微博主题进行相似计算,最后等到实时的微博推荐结果。实验表明,此方法能有效地进行微博推荐。实验表明:本文提出的微博用户兴趣模型及推荐方法能够有效地表征微博用户的兴趣并给出了相对准确的推荐结果。