基于社交媒体行为的用户人口统计属性推断

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wwwdslyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的发展和社交媒体网络的应用普及,越来越多的人使用多种多样的在线社交媒体服务,产生了海量的社交媒体内容信息并使得用户面临信息过载的问题。为此,如何更好地分析和理解用户,为用户提供个性化的信息服务,成为社交媒体的主要任务和挑战。用户人口统计属性,包括年龄、性别、婚姻状况和职业等,是理解和进行用户画像的基础。用户在社交媒体网络中产生的海量多媒体内容数据与丰富的用户行为信息,隐含地揭示了关于用户个人信息的重要线索,为解决社交网络中用户人口统计属性的缺失与稀疏问题提供了解决途径。基于此,本文重点研究如何利用用户的社交媒体行为来进行用户人口统计属性的推断,具体从用户人口统计属性的关联性和稳定性这两个特点出发,进行了如下三个方面的研究工作:  1.提出了基于超图学习的关联性用户人口统计属性推断方法。用户不同的人口统计属性之间存在着关联。在用户社交媒体行为的基础上,合理地利用用户已知的人口统计属性及其关联性,可以有效地帮助进行未知人口统计属性的推断。在超图中,将顶点表示为社交媒体网络中的用户,将超边表示为用户产生内容的相似性和属性之间的关系。利用超图模型,将用户属性挖掘形式化为一个正则化的标签相似性传播问题,可以有效推断用户的人口统计属性。  2.提出了基于对偶投影矩阵的跨社交媒体网络用户人口统计属性推断方法,解决了动态的社交媒体行为和相对稳定的人口统计属性之间的矛盾。基于存在唯一且稳定的人口统计属性导致用户在不同社交媒体网络中表现出不同的动态行为的假设,将用户在不同的社交媒体网络中的行为特征统一地投影到同一个空间中进行用户人口统计属性推断。在Google+和Twitter的真实数据集上的实验验证了提出方法的有效性。  3.提出了基于多源自编码器的跨社交媒体网络用户人口统计属性推断方法。基于用户人口统计属性的稳定性,寻找到用户在不同社交媒体网络中的共享行为模式,解决相对稳定的人口统计属性与动态的社交媒体行为之间矛盾,并处理用户标记数据难以获取的问题。该方法采用分层学习模型,利用更多社交媒体网络中无人口统计属性标记用户的行为数据寻找用户的共享行为模式,得到稳定的用户特征表达,再对有人口统计属性标记的用户进行用户人口统计属性推断的研究。该方法充分地利用大量无标记用户数据,找到不同社交媒体网络的共享行为模式,有效地提高用户人口统计属性推断的准确率。
其他文献
瞬变电磁法是在接地导线或不接地回线中通以脉冲电流(常为矩形波、半正弦波、梯形波)作为激发场源使地下产生一次脉冲磁场,来激励探测目的物感生二次电流,在脉冲间隙通过接收线
学位
仿生眼是智能机器人系统中必不可少的组成部分。目前,国内外关于仿生眼的研究主要集中于仿生运动和视觉感知机理方面,但如何将目标三维信息与仿生眼的仿生运动控制进行有机结合
网络控制系统(NCS,Networked Control System)是指传感器、控制器和执行器机构通过通信网络形成闭环的控制系统。在网络控制系统中,网络成为一种媒介实现分属于不同区域里的
随着深度网络的提出,人工神经网络(ANNs)又一次取得了重大的研究进展。ANNs已经应用到许多领域,比如智能感知,系统辨识和控制,决策制定和数据挖掘。然而,ANNs具有一个致命的缺陷,即
随着电力系统中非线性负载的大量应用,电网谐波污染日益严重,谐波成为影响电能质量的主要因素之一。有源电力滤波器是近年来发展快速的一种能够动态抑制电网谐波的电力电子装
目标检测是计算机视觉领域中长期关注的问题,而行人检测是目标检测的典型问题,在无人驾驶、智能监控、智能机器人等领域中都具有重要应用价值。历经十多年的探索,行人检测技术进
本论文主要针对工业中薄壁环形微零件以及细长轴型零件装配过程中的相关问题进行了研究,包括如何快速、有效、可靠的获取多路显微视觉系统之间的相对视角信息,如何充分利用多路
随着国民经济的发展和人们生活水平的提高,用户对电能质量的要求也越来越高,电力系统中谐波抑制是满足该要求的一个重要条件。而谐波检测是谐波抑制问题的基础和出发点。实时
机器学习算法分为在线算法和批处理算法,两个算法适用于不同的场景,在线算法适合实时更新数据的场景,例如在大量样本集的情况下,在线算法时间空间复杂度很小;同时由于现实中
本课题来源于国家“863”重点项目子课题“分布式地面-坑道电磁接收系统研制”和中石油项目“时频电磁法采集系统设计及噪声相干编码技术研究”。电法勘探主要利用被测体的电