论文部分内容阅读
随着互联网技术的快速发展,社交媒体的新概念进入了人们的视野,并影响和改变着人们的日常生活。社交媒体是一个公共、开放的平台和工具,人们在这个平台上自由地交流、表达、分享产生了海量的数据。如何利用社交媒体平台上海量的数据信息,提供有价值的服务是当今研究的热点。用户画像则是通过用户的基本属性内容、行为内容等海量信息抽象得出的一个“标签化”的用户模型,其研究结果对于精准营销、智能推荐、信息检索等服务具有重要的意义。本文通过社交媒体下的数据源为基础分析、构建得出用户画像模型,重点研究了单模态的动态用户画像和多模态的用户画像。本文提出了一种新颖的动态用户画像模型Dynamic User Profile Model(DUPM),通过社交媒体数据源的获取、文本预处理、主题提取和用户属性挖掘等步骤最终构建得出用户的动态属性特征。特别地,本文引入了时间窗口的概念加入时间因素,同时通过衰减函数来获取动态的用户属性,有助于预测分析用户将来一段时间内的兴趣爱好,并通过大量实验分析验证了本模型的有效性。此外,本文还提出了多模态用户画像模型multi-modal User Profile Model(mmUPM),通过对多元数据获取、文本和图片特征提取及融合方法、用户画像深度学习模型的研究实现了多模态数据源的用户画像构建。在实现过程中,本文利用Zhou[29]提出的Poisson Gamma Belief Network(PGBN),构建出适用于大规模社交媒体平台数据的五层深度学习网络,最终采用四种多标签算法进行实验评估,并经过大量的对比实验可以证明本文提出的模型的可行性。