论文部分内容阅读
近年来,凭借着在内容生成方式和信息扩散速度等方面的优势,社交媒体(Social Media)得到了极大的发展,已经成为越来越多的人日常使用的信息分享和线上交互工具。有别于传统的即时交互应用,社交媒体中用户在线交互以消息为载体,使得用户交互行为数据的内容和形式都极为丰富。对这种高质量用户数据的分析和建模,可以揭示用户在线行为背后蕴藏的用户偏好和行为模式,为社交媒体个性化推荐提供更加丰富的支撑知识。当前,对用户交互行为的研究多关注于信息在社交媒体中的传播,且局限于对特定类型用户行为的理解,使得已有行为模型和相关算法的应用范围非常有限。此外,现有工作对影响用户交互选择的多样化因素探索不足,忽略了文本、图片等多模态内容信息,时间空间等上下文信息,以及情感倾向等用户个性化特征对用户交互的影响,在解决相应的预测和推荐问题时无法取得理想的效果。针对上述问题,本文以社交媒体中最具代表性且最常见的两种用户交互行为——“提及”和“转发”——为研究对象,从大众用户的在线交互角度着手,以探索如何整合多类型的数据对用交互户行为建模、实现不同场景下的用户和内容推荐为核心研究目标,在三个具体方面对社交媒体用户交互行为开展系统性的研究。本文旨在探索社交媒体用户隐式个性与显式行为之间的联系,促进学术界对社交媒体用户交互行为数据的深入研究,同时为信息传播监控、商业智能、社会化精准营销等工业界应用提供新的数据模型和算法框架。具体来说,本文的主要研究工作和贡献如下:1.基于多模态内容的用户提及行为建模与目标推荐随着信息获取方式和上传渠道的日益丰富,社交媒体用户生成数据日趋多模态化,消息中视觉资源的比重越来越高。经过观察和实验,本文发现除了文本内容外,视觉资源(如消息中的图片)衍生的可视内容也能为揭示用户提及倾向提供有价值的信息。基于此,本文提出一个概率生成模型MMTM(Multi-modal Mention Topic Model),建模用户的在线提及行为。MMTM通过对消息文本内容和视觉内容进行综合建模,模拟用户提及活动的生成。MMTM能够同步地学习用户多模态的语义模式、不同模态内容间的联系及其对用户提及趋势的联合影响。基于MMTM,对于一条多模态提及消息,本文为其检索前k个可能性最大的目标用户形成提及目标推荐。构建在大型真实数据集上的实验结果表明,本文所提方法在各指标下的实验性能表现均显著优于已有算法。2.空间上下文感知的提及目标用户快速推荐得益于可定位设备尤其是智能移动终端的大量普及,地理维度的信息开始在社交媒体数据中迅速扩散,为我们更好地理解用户物理活动驱动的在线行为提供了宝贵的机会。通过将空间因素整合进用户在线行为模型,可以更精确地获取用户行为模式和个人偏好。本文通过对真实社交媒体数据的分析,观察到了两个存在于用户提及活动中的地理现象,揭示了当前用户和目标用户间的空间关联,能够激发对空间上下文感知的用户提及行为建模与目标用户推荐的研究需求。据此,本文提出一个联合概率生成模型SCOMM(Spatial COntext-aware Mention behavior Model),通过综合考虑用户的语义和空间因素生成用户位置标记的提及活动,能够以一种统一的方式对当前用户的语义偏好、目标用户的地理聚集区域及其对用户移动模式的联合影响进行建模。同时,本文设计了一个高效的混合剪枝算法,通过在空间和语义维度上的同步剪枝,加快对在线查询的响应速度、大幅提高推荐效率。此外,本文设计一个基于词汇地理分布差异和用户社交图谱的位置推理方法,实现对用户居住位置的细粒度定位,减轻位置数据的高稀疏性对用户提及行为建模精度的影响。在大型真实社交媒体数据集上进行的实验结果表明,本文提出的方法在提及目标推荐有效性和效率方面均有优异表现。此外,本文所提出的用户位置推理方法准确地定位了超过80%的用户的居住城市,证明了基于文本词汇的地理属性进行用户位置推断的可行性和有效性。3.情感增强的动态用户转发行为建模与推荐社交媒体中的转发机制在提升消息质量、增强用户交流体验和追踪网络信息流向等方面扮演着重要的角色。已有针对社交媒体转发机制的研究主要关注消息散播、信息流向方面的问题,很少有工作探索如何为一个普通用户寻找其最有可能转发的消息,即针对用户的个性化转发消息推荐问题。此外,虽然一些研究基于用户、内容、关系相关的特征来提高转发预测/推荐的有效性,当前仍缺乏对上述因素对于用户转发选择的联合影响的综合分析,尤其是针对转发消息推荐问题。同时,动态大众兴趣和用户情感偏向对用户转发行为的影响没有受到已有工作的足够重视。针对这些问题,本文提出一个联合概率生成模型SDRM(Sentiment-enhanced Dynamic user Retweet behavior Model)对各影响因素进行综合建模、模拟用户转发行为的决策过程。SDRM学习用户内在兴趣和时间敏感的大众兴趣相关的主题,并结合用户对消息的情感倾向、消息热度和用户的社交图谱,以一种统一的方式对社交媒体用户转发行为进行建模。基于SDRM,本文构建了一个情感增强和时间上下文感知消息转发推荐系统,为用户推荐其最有可能转发的消息。构建在真实数据集上的实验结果表明,本文所提方法在各指标下的实验性能均显著优于对比方法。此外,实验结果还证明,时间敏感的大众兴趣和用户对消息的情感倾向是影响其转发消息选择的重要因素。