社交媒体用户交互行为建模与推荐应用研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:chamcham
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,凭借着在内容生成方式和信息扩散速度等方面的优势,社交媒体(Social Media)得到了极大的发展,已经成为越来越多的人日常使用的信息分享和线上交互工具。有别于传统的即时交互应用,社交媒体中用户在线交互以消息为载体,使得用户交互行为数据的内容和形式都极为丰富。对这种高质量用户数据的分析和建模,可以揭示用户在线行为背后蕴藏的用户偏好和行为模式,为社交媒体个性化推荐提供更加丰富的支撑知识。当前,对用户交互行为的研究多关注于信息在社交媒体中的传播,且局限于对特定类型用户行为的理解,使得已有行为模型和相关算法的应用范围非常有限。此外,现有工作对影响用户交互选择的多样化因素探索不足,忽略了文本、图片等多模态内容信息,时间空间等上下文信息,以及情感倾向等用户个性化特征对用户交互的影响,在解决相应的预测和推荐问题时无法取得理想的效果。针对上述问题,本文以社交媒体中最具代表性且最常见的两种用户交互行为——“提及”和“转发”——为研究对象,从大众用户的在线交互角度着手,以探索如何整合多类型的数据对用交互户行为建模、实现不同场景下的用户和内容推荐为核心研究目标,在三个具体方面对社交媒体用户交互行为开展系统性的研究。本文旨在探索社交媒体用户隐式个性与显式行为之间的联系,促进学术界对社交媒体用户交互行为数据的深入研究,同时为信息传播监控、商业智能、社会化精准营销等工业界应用提供新的数据模型和算法框架。具体来说,本文的主要研究工作和贡献如下:1.基于多模态内容的用户提及行为建模与目标推荐随着信息获取方式和上传渠道的日益丰富,社交媒体用户生成数据日趋多模态化,消息中视觉资源的比重越来越高。经过观察和实验,本文发现除了文本内容外,视觉资源(如消息中的图片)衍生的可视内容也能为揭示用户提及倾向提供有价值的信息。基于此,本文提出一个概率生成模型MMTM(Multi-modal Mention Topic Model),建模用户的在线提及行为。MMTM通过对消息文本内容和视觉内容进行综合建模,模拟用户提及活动的生成。MMTM能够同步地学习用户多模态的语义模式、不同模态内容间的联系及其对用户提及趋势的联合影响。基于MMTM,对于一条多模态提及消息,本文为其检索前k个可能性最大的目标用户形成提及目标推荐。构建在大型真实数据集上的实验结果表明,本文所提方法在各指标下的实验性能表现均显著优于已有算法。2.空间上下文感知的提及目标用户快速推荐得益于可定位设备尤其是智能移动终端的大量普及,地理维度的信息开始在社交媒体数据中迅速扩散,为我们更好地理解用户物理活动驱动的在线行为提供了宝贵的机会。通过将空间因素整合进用户在线行为模型,可以更精确地获取用户行为模式和个人偏好。本文通过对真实社交媒体数据的分析,观察到了两个存在于用户提及活动中的地理现象,揭示了当前用户和目标用户间的空间关联,能够激发对空间上下文感知的用户提及行为建模与目标用户推荐的研究需求。据此,本文提出一个联合概率生成模型SCOMM(Spatial COntext-aware Mention behavior Model),通过综合考虑用户的语义和空间因素生成用户位置标记的提及活动,能够以一种统一的方式对当前用户的语义偏好、目标用户的地理聚集区域及其对用户移动模式的联合影响进行建模。同时,本文设计了一个高效的混合剪枝算法,通过在空间和语义维度上的同步剪枝,加快对在线查询的响应速度、大幅提高推荐效率。此外,本文设计一个基于词汇地理分布差异和用户社交图谱的位置推理方法,实现对用户居住位置的细粒度定位,减轻位置数据的高稀疏性对用户提及行为建模精度的影响。在大型真实社交媒体数据集上进行的实验结果表明,本文提出的方法在提及目标推荐有效性和效率方面均有优异表现。此外,本文所提出的用户位置推理方法准确地定位了超过80%的用户的居住城市,证明了基于文本词汇的地理属性进行用户位置推断的可行性和有效性。3.情感增强的动态用户转发行为建模与推荐社交媒体中的转发机制在提升消息质量、增强用户交流体验和追踪网络信息流向等方面扮演着重要的角色。已有针对社交媒体转发机制的研究主要关注消息散播、信息流向方面的问题,很少有工作探索如何为一个普通用户寻找其最有可能转发的消息,即针对用户的个性化转发消息推荐问题。此外,虽然一些研究基于用户、内容、关系相关的特征来提高转发预测/推荐的有效性,当前仍缺乏对上述因素对于用户转发选择的联合影响的综合分析,尤其是针对转发消息推荐问题。同时,动态大众兴趣和用户情感偏向对用户转发行为的影响没有受到已有工作的足够重视。针对这些问题,本文提出一个联合概率生成模型SDRM(Sentiment-enhanced Dynamic user Retweet behavior Model)对各影响因素进行综合建模、模拟用户转发行为的决策过程。SDRM学习用户内在兴趣和时间敏感的大众兴趣相关的主题,并结合用户对消息的情感倾向、消息热度和用户的社交图谱,以一种统一的方式对社交媒体用户转发行为进行建模。基于SDRM,本文构建了一个情感增强和时间上下文感知消息转发推荐系统,为用户推荐其最有可能转发的消息。构建在真实数据集上的实验结果表明,本文所提方法在各指标下的实验性能均显著优于对比方法。此外,实验结果还证明,时间敏感的大众兴趣和用户对消息的情感倾向是影响其转发消息选择的重要因素。
其他文献
羽毛球反手技术是该项运动的教学难点。普通高校羽毛球反手击球技术教学由于课时的限制,缺少系统介绍和专项基础练习,学生误区较多,提升速度慢,本文对如何提高校羽毛球反手击球技
摘要:电力企业由计划经济向市场经济转移,经济效益和社会效益都是其重要的追求目标,而提高供电可靠性和降低生产成本是实现目标最重要的途径和提高经济效益的关键。由于状态检修是提高供电可靠性和降低设备检修费用的重要措施,而设备检修费用在整个生产成本中占有相当大的比例,因此从提高经济效益的角度来看,定期检修已不能满足形势发展的要求。  关键词:新技术 电气设备 检修 应用  1.设备状态检修的含义  设备状
针对大型石油储罐内防腐施工中存在易燃气体浓度超标、露点影响区覆盖层的附着力下降、油罐焊缝部位的腐蚀等问题,研制出了一种新型的E52-9环保型导静电防腐涂料,从成膜基料
桑叶在我国具有极大的资源优势,可以药食两用。桑叶中含有丰富的蛋白质、多糖、生物碱及酚类等活性成分,具有降血糖、抗氧化等活性。其中,酚酸、多糖、1-脱氧野尻霉素、γ-氨
与莎士比亚的其他剧作相比,其罗马剧《裘利斯.恺撒》中的“市民”形成了一股与悲剧主人公相抗衡的力量,“市民”在一定的意义上决定了悲剧主人公的成败,莎士比亚的剧作在如实
编者按:“教育家办学”思想是温家宝总理对教育提出的新的重大命题。时下,“教育家办学”这个重大教育命题越来越引起基础教育界的关注,越来越凸现出其强势的影响力。因此,对这一命题的解读应当做更多、更深入的工作。本刊将连续刊发林森教授的有关系列文章,为校长和教师认知、实施这一重大教育命题,作一理论与实践上的引领与参考。    一、“教育家办学”:温家宝总理提出的重大教育命题  “教育家办学”思想是温家宝总
目的了解儿保门诊婴儿喂养现况及其对婴儿体格生长的影响。方法 2008年6月至2009年5月在儿保门诊非随机对健康体检的978名2~12月龄婴儿主要抚养人进行问卷调查,获得婴儿乳类和
医院财务分析是指运用事业计划、财务报表、统计数据等相关资料,对一定时期内的财务活动和经济活动过程进行比较、分析和研究,并进行总结,作出相应评价的一种方法。进行系统严谨