社交网络平台用户身份挖掘的研究

来源 :南京大学 | 被引量 : 2次 | 上传用户:xt100q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络平台(例如新浪微博、Facebook等)用户身份挖掘是数据挖掘领域的新兴研究内容,本文针对其中两个重要问题,即用户身份标注和跨平台用户身份匹配开展研究,主要取得以下创新成果:1.提出能适应用户标记数变化的单标记用户身份标注算法。以往用户身份标注算法通常假设标记数不变,如果出现训练数据中未见过的标记,模型准确性将会受到影响。本文在单标记假设下,根据应用对准确性和高效性的不同要求,分别提出能适应用户标记数变化的算法SENCForest和SENC-MaS。真实数据上的实验测试验证了本文算法的有效性。2.提出能适应用户标记数变化的多标记用户身份标注算法。以往多标记用户身份标注算法在标记数变化的场景中,模型准确性将会受到影响。本文提出基于用户全局特征和局部特征的用户身份标注算法NL-Forest,不仅可以标注已知标记,还能够在多标记场景中检测出新出现的标记,并且对模型更新。真实数据上的实验测试验证了本文算法的有效性。3.提出能适应用户数变化的跨平台用户身份匹配算法。以往用户身份匹配算法通常基于静态用户数据建模,然而现实任务中用户数通常会发生变化。本文提出一种新的用户身份匹配框架,即基于用户隐空间的框架,并提出算法ULink-On,能随着用户数变化不断更新隐空间模型,最终在隐空间中匹配用户身份。真实数据上的实验测试验证了本文算法的有效性。4.提出能适应用户生成内容变化的跨平台用户身份匹配算法。以往跨平台用户匹配算法,通常假定用户生成内容不发生变化。然而现实任务中用户生成内容是经常变化的。本文提出一种适应用户生成内容变化的跨平台用户身份匹配算法AD-Link,通过学习带权重的匹配模型更好地量化生成内容间的重要性。真实数据上的实验测试验证了本文算法的有效性。5.提出能适应用户描述变化的跨平台用户身份匹配算法。以往用户身份匹配算法通常假设用户描述是不可变的,然而现实任务中用户描述会随着社交平台功能的发展而变化。本文提出一种适应用户描述变化的跨平台用户身份匹配算法AD-Link-f,通过建立已有描述和新描述间的联系使模型更快地适应新环境。真实数据上的实验测试验证了本文算法的有效性。
其他文献
混凝土结构加固是建筑工程中常见的施工环节,对于改善建筑使用性能,提高建筑安全稳定水平具有良好的促进效果。文章围绕建筑工程混凝土结构加固设计相关内容进行讨论,阐述了
目的了解护理人员对不同护理差错处理方式的态度,为建立"针对性非惩罚性"护理差错管理制度提供依据。方法对10名护理人员进行深度访谈,将获得的资料运用Colaizzi分析法和合众
<正>1912年元月1日,孙中山在南京就任中华民国临时大总统,民国时代从此开启。在《建国方略》中,孙中山描绘的"现代化"、"工业化"蓝图令人憧憬。虽然孙中山没有给出建设南京的
本文以各地行政审批中心成立为"准自然实验",结合中国微观企业数据,采用双重差分法和三重差分法,系统考察了行政审批制度改革对企业创新活动的影响。研究发现:行政审批中心的
为了探寻郑麦9023在江汉平原地区的最适播种密度,设置基本苗120、150、180、210、240、270万/hm2等6个密度水平,探讨了不同播种密度对小麦叶片SPAD值、地上部单茎干物质积累
近年来,有关唐代瓜州(晋昌郡)治所位于何处的讨论引起了众多历史地理学者的重视,对于此问题,学界看法不一,众说纷纭。本文在前人研究的基础上,结合孙修身先生《唐代瓜州晋昌
提问交互模型(QICT模型)是在Paul的批判性思维元素和标准的在线学习模型基础上改进形成的。文章针对批判性思维教学中的困难,结合脚手架的思想,探讨QICT模型在异步在线交流环
<正>一、图式与图式理论简介众所周知,图式的基本概念最早由Kant于1781年提出,到1932年,Bartlett将图式基本理论发展成为较为系统的理论,经历了一百五十年之久。Bartlett在实
目的比较氟康唑治疗老年院内获得性白色念珠菌肺炎的3种给药方案,以寻求更安全、有效、经济的治疗方法。方法将135例患者随机分为3组,即氟康唑静滴组(0.2 g静脉滴注,1次/d)、序
提出了一种鲁棒的基于多镜头全景相机的柱面全景影像拼接方法:通过相机标定对原始影像进行畸变纠正;基于SURF算法对投影生成的柱面影像提取特征点后,用改进的BBF方法提高获取