基于复杂网络分析的社交媒体账号分类方法

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:qz824zane
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络的蓬勃发展丰富了人与人之间的社交关系,推特作为一种主流的社交工具,蕴含着海量活跃账号以及这些账号发表的推文。对推特账号的分类研究有利于人们从海量推特账号中挖掘出感兴趣的账号,进而根据不同的账号类别做差异性处理。现有的研究中,对于推特账号的分类方法主要还是使用账号的基本属性特征或者推文文本特征,这些分类方法忽略了推特账号的社交网络结构特征,而账号的社交网络结构特征能够反映出账号的基本社交关系以及账号之间的相互影响,充分利用社交网络结构特征有利于提高账号分类的效果。本文借鉴复杂网络思想,利用社交网络结构特征,将推特社交网络分类问题转化为复杂网络分析问题,从而实现社交网络账号分类。本文的主要工作与创新概括如下:(1)根据推特社交网络中的不同社交行为,提出了一种异质网络构建方法。本方法引入了账号、推文、事件、人物以及hashtag这5种类型的节点,并从原始推特数据中挖掘出这些节点之间的连接关系,从而形成了一个能够反映推特社交关系的异质网络。这一异质网络包含着账号的社交网络结构特征,是后续进行账号分类任务的基础。(2)基于构建的异质网络,提出了一种直推式学习的账号分类方法。相比于归纳学习方法,直推式学习不仅可以利用已知训练样本数据,还可以利用未标记的样本之间的聚簇关系,适用于训练样本不够充分的应用场景。本文根据异质网络中账号的不同社交行为,可以提取出不同类型的元路径来构建账号之间的影响关系矩阵,进而将已知样本的标签信息扩散到异质网络中的其他节点。(3)提出了一种异质网络表示学习方法。异质网络包含了丰富的节点网络结构特征,将这些特征提取出来并形成节点的特征向量可以有助于提高账号分类的性能。本文提出了异质网络随机跳跃算法,用来挖掘异质网络中节点的上下文关系,进而训练表示学习模型,从中提取出节点的网络结构特征。实验结果表明异质网络表示学习方法能够实现较好的账号分类效果。
其他文献
<正>设计中自然的抽象,即是将自然界中的事物形象运用再创造的手段进行视觉化的再现与表现。在设计美术的发展过程中,这种视觉再现形式因时代的不同呈现出不同的表现形式。从
本文针对戴尔(中国)的现状,以及暴露出的问题,提出了改善戴尔(中国)经营现状的建议,希望能对戴尔有借鉴意义。
目的探讨喹硫平联合艾司西酞普兰治疗有精神病性症状的抑郁症的临床效果。方法选取我院2016年1月至2017年1月期间收治的50例精神性病症的抑郁症患者作为研究对象,将其随机分
目的:通过检测口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)及癌前病变中PTEN、PIP3、MAPK、Cyclin D1、CDK4蛋白的表达情况,探讨PTEN在口腔鳞癌的发生和发展过程中所
目前我国各地城市道路、高等级公路路面基层大部分采用水泥稳定碎石基层,在施工中其技术指标控制不好或受外界环境、温度、气候、荷载的影响容易产生多种病害现象,本文根据工
目的探讨性早熟女童血清生长激素释放肽(ghrelin)与生殖激素的关系。方法将87例年龄在5~9岁的性早熟女童根据第二性征发育情况、骨龄、子宫、卵巢容积及促性腺激素释放激素(GnRH)
2001年河南省国家税务局建立了数据全省集中处理的人事管理信息系统,该系统为人力资源的科学配置与利用起到了积极的推动作用,也受到了省局、总局领导的高度评价。在以后的几
一、问题的提出进入高三复习后,习题讲评课成为常态课型.很多教师为了赶进度追求课堂容量,满堂灌地把答案讲完,至于思路如何形成,学生能否想到,这些题的解决需要学生具备什么
【目的】临床上糖尿病和心血管疾病并存十分常见。2型糖尿病患者的心血管事件发生率是非糖尿病个体的2~4倍,而心血管事件又是糖尿病的主要死亡原因。口服降糖药物对心血管事
<正>人物画题材内容是指艺术品所描绘的对象、所表现的内容,以人物形象为主体,并经过艺术家的选择、提炼、加工之后在艺术中的反映。它通过对人物、人物的活动及其