跨社交媒体的账户匹配方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:Garyzhaoqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着移动通信技术的飞速进步,社交媒体也迎来了爆发式的增长。人们将各种社交媒体网站用于不同目的,并且在使用这些社交媒体服务时在网络上留下了自己独特的“数字足迹”。对社交媒体中的用户数据进行挖掘能够获得很多有利于社交网络控制、管理等方面的价值信息。然而,社交媒体数据通常具有离散、碎片化的特点,导致对单一类型的社交媒体数据进行挖掘效果不佳,因此若能通过跨社交媒体分析的手段整合来自多个社交媒体属于同一个用户实体的数据,将能更好地为社交网络的控制、管理服务。跨社交媒体的账户匹配方法能够识别相同用户在不同社交媒体的账号,是跨社交媒体数据分析的基础。而传统的利用分类模型判断账户是否属于同一个人物实体的方法忽视了数据集的PU(Positive and Unlabeled,PU)问题,训练出来的模型泛化能力差,再加上提取账户特征的方法面临特征稀疏以及难以有效利用社交关系特征的困境,导致传统方法无法在实际社交网络数据分析中广泛应用。本文针对上述问题研究实用化的跨社交媒体账户匹配方法。通过社交媒体上公共的少量用户信息,从海量的账户数据中快速发现属于同一人物实体的社交媒体账户。为解决账户公共属性稀疏问题,本文从用户名和账户好友关系这两个跨平台公有的属性提取特征,并在以下两个方面取得成果:(1)提出基于用户名特征的账户快速匹配算法。该方法从两个待匹配账户的多个用户名提取相对特征,使用分类器判断账户是否匹配;并提出一种主动学习的方法来改良数据集,解决数据集PU问题,通过这种方法提高了分类器精确率以及泛化能力;最后,通过融合社交关系获得待匹配账户对,减少账户匹配过程中的计算量,实现快速账户匹配。该方法准确率高,并且适用于大多数社交媒体平台。(2)提出利用网络表征学习技术提取社交关系特征,解决账户社交关系特征抽取的问题。采用基于随机游走的网络表征学习技术学习账户之间连接关系的潜在特征,将账户向量化,同时利用核技巧解决不同网络空间中节点向量的映射问题,将向量映射和相似度计算两个过程融合到分类器模型之下。该方法召回率高,可以通过并行化的实现方式应用在大规模数据集中,可伸缩性强。
其他文献
湖南日报5月25日讯(记者 戴勤 肖祖华)5月24日晚8时,洞口县(艹那)溪瑶族乡宝瑶村村部会议室仍灯火通明,邵阳市委扩大会议还在继续。从中午1时开始,会议已持续7个小时。市委书记龚文
报纸
目的:研究肿瘤出芽与乳腺癌临床病理特征、肿瘤浸润淋巴细胞(TILs)以及患者预后的关系。方法:收集2012年1月~2016年12月于暨南大学附属第一医院行手术治疗的178例乳腺癌患者资
在大样本问卷调查的基础上,通过客观描述云南藏区多民族交错杂居并具有典型性的中心城镇——建塘镇——族际交往过程中语言使用的现实图景,深入分析该区域各民族群体语言能力
语言构成三大要素是词汇、语法、语音,其中词汇尤为重要,它是交流的基础,所以外语教学离不开词汇教学。我国《普通高中英语课程标准》(2017年版)要求高中阶段掌握3000-3200个单词和1000-1500个新单词和一定数量短语,优秀的要达到4000-4200个词汇。但是词汇对于学生来说,一直都是英语学习的重难点;对于教师来说,词汇记忆教学也是英语教学的关键所在。而词汇记忆并不是机械式背诵的过程,这就
道面坡度测量对于精细化导航系统及场面运行模拟系统的开发具有重要意义。采用微机械电子系统(micro-electro-mechanical system,MEMS)传感器进行加速度估计的方法提取道面坡度通常需要增加额外的传感器,同时还会受到累积误差的困扰。本文提出的基于智能手机MEMS传感器的道面坡度提取方法,不需要额外的传感器支持,采用零加速状态检测的方法实现对累积误差的修正,进而通过旋转四元数估
面对互联网时代日益纷繁的传播渠道,媒体对体育赛事版权开发成为新的命题。信息技术的高速发展带来了新的传媒革命,新媒体的崛起使传播手段日趋多样化。与此同时,国家逐步开放了媒体的体育赛事转播权,伴随着互联网时代媒体集团资本市场的兴盛,当下我国体育赛事媒体版权的开发发展到了一个新的节点。面对水涨船高的体育赛事版权价格,如何开发体育赛事版权成为我国媒体要面对的新问题。本文从NBA在中国的传播开始,结合传播技
<正>《义务教育语文课程标准(2011年版)》明确指出:"写作是运用语言文字进行表达和交流的重要方式,是认识世界、认识自我、创造性表达的过程。写作能力是语文素养的综合体现
中学生追求异性及谈恋爱问題,目前在学校里表现此较突出。很多从事教育工作的同志对这类问題感到很棘手。对这个问题的看法及解决办法目前也很不一致,这是中学教育需要解决
侵权责任法是规定侵权行为及其法律责任的法律规范的总称。我国侵权责任法作为私权保障法,它是通过对受到侵害的民事权益提供救济的方法来保障私权的,也正是通过保障私权来奠
本文从四川省生猪价格保险的试点现状出发,分析了我国生猪价格保险的发展特征和试点成效,重点探讨了生猪价格保险大范围推广可能面临的困境。针对这些困境,提出了相应的具体