社交网络账号的智能分类方法

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:style_xo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,以推特(Twitter)、领英(LinkedIn)、微博为代表的在线社交网络越来越受到人们的青睐和关注。推特作为全球最大的在线社交网络,已经成为国外网民发表自己意见和分享讯息的重要平台。推特每日活跃着海量的账号(用户),推特中的账号又会发布或者转发大量的文本信息,通常账号发布或者转发的文本信息与账号的兴趣爱好及个人生活息息相关,另一方面,账号也会倾向于关注与自己有相同兴趣爱好的其他账号,彼此之间的如转发、提及等互动行为也会更加频繁。社交网络账号的分类问题正是基于上述的情况,利用账号发布的文本内容以及账号间的关系信息来实现账号分类,以达到特定类别账号个性化推荐、识别封禁垃圾账号等目的。本文以推特社交网络中的账号为研究对象,从账号发布的文本内容和账号关系的角度出发,对推特的账号分类问题展开研究,主要研究内容如下:1.针对账号的文本表征问题,本文以分布式词嵌入模型word2vec为基础,考虑到传统的词嵌入模型是一个无监督的训练过程,提出了半监督账号文本嵌入表示模型Semi-User2vec,将账号的文本信息映射为一个稠密的低维向量,生成带有标签信息的账号文本特征向量,然后作为分类器——支持向量机(Support Vector Machine,SVM)的输入,进行账号的分类。2.针对账号文本和账号间关系的融合问题,考虑到社交网络中相同类别的账号在发布推文会经常出现彼此之间互相提及(@关系)这一互动行为的情况,本文从推文中提取账号间的提及关系,构建提及关系网络,并且借鉴词移距离模型,利用半监督文本嵌入表示Semi-User2vec作为输入,来计算账号在社交网络的邻居相似度,并在邻居相似度计算的特性的基础上,提出了基于集成学习的融合账号文本特征和邻居相似度的账号分类方法。3.针对如何利用多维关系进行账号分类的问题,本文对推特的数据进行处理,构建多维关系网络——提及、转发、好友关系网络,在目前新兴的图神经网络方法的基础上,本文提出了多维图卷积网络,并在图卷积网络机制的基础上,利用传统神经网络中的注意力机制,实现多种关系网络的融合,进行推特账号的分类。
其他文献
黑龙江美术出版社出版发行,邓福星先生策划、主编的《美术学文库》,历经十余年的风雨坎坷,终于赶在新世纪悄然来临之前面世。第一辑凡十种,洋洋洒洒数百万言,颇具规模。“十
刑事证明标准是刑事诉讼证据理论体系中的核心问题,更是每一个刑事司法工作人员不得不思考的问题。长期以来,我们片面、机械地用唯物论的可知论来论证刑事证明的绝对性,实行
<正>本世纪初期,金城是一位很有地位的美术家,被称为北京美术界的“教主”,中国画学研究会则是金城等一手创立的美术社团,持续活动近三十年之久,影响遍及国内外。在建国后的
审判独立原则已经得到现代法治国家的普遍确立,它已成为保护人权,制约权力,宣誓与捍卫司法公正,分配与实现社会正义的有力武器。实现审判独立无疑是我国当前司法改革的关键所
食品安全是生命安全的前提和基础,关乎着人们的生活质量和生命健康。中国的饮食博大精深,烹饪工艺技法受到各个国家的青睐,但烹饪食品的安全健康特性仍存在一些问题。饮食是
近年来,随着我国社会生产生活水平的不断发展,我国电网的整体规模也在不断发展,特别是调控一体化模式的推进,使得我国电网系统实时监控的信息量也逐渐增长。在此背景下,电力
论文紧紧围绕周恩来和平与发展思想,分别探讨了这一思想的产生背景、形成过程、理论基础、内容体系和历史地位。本文对研究对象采取静态分析与动态考察相结合的思路,注重从新
针对过程工业的复杂性及其数据特点,讨论了数据挖掘技术工业应用的基本思想,提出了复杂过程工业应用数据挖掘技术的基本策略。
研究了用以硫代硫酸盐浸出-树脂浆法为基础回收金的工艺处理Barrick公司的美国内华达州卡林型Goldstrike矿石的可能性。该矿石属于含碳的窃金矿石。这种矿石适于在温和的条件