社交媒体中协作用户检测

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:gf5ete346v
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体的快速发展吸引了大量用户,从而迅速成为企业和个人进行营销和推广活动的重要场所。在这些活动中,通过帐号的有组织协作行为,可以迅速产生相似信息的大量重复出现,从而提高信息的展示次数,影响普通用户。协作行为的发现与过滤对于垃圾信息清理、舆情分析、精准营销都具有重要作用。然而,由于社交媒体数据量大、数据更新迅速、协同行为相对密度低,社交媒体中准确、高效地协作行为发现具有重要的研究意义。本文研究了社交媒体中的协作行为和协作用户发现问题,主要贡献如下:1.对社交媒体中采用协作行为进行营销和推广的手段进行了分类,定义并描述了四种典型的协作行为用户,对它们的协作行为特征、用户特征、数据特征进行了分析,并分别设计了协作行为检测方法,为社交媒体协作行为发现与过滤确定了框架。2.提出了基于局部敏感哈希(Locality-sensitive Hashing, LSH)的社交媒体消息重复性检测方法,及其高效MapReduce实现,以发现协作行为用户所产生的大量近似重复性消息。这一方法所检测到的协作行为用户与其它用户具有明显不同的用户信息、社交网络结构,以及行为模式。实验结果表明,该方法能够有效定位隐式与显式营销帐号。3.利用帐号的转发特征,提出了基于主题模型的社交媒体协作行为和协作帐号组发现方法。该方法首先利用帐号与消息、帐号与帐号之间的关系,确定帐号的转发画像(retweet profile,RP),并利用LDA方法,发现具有相似行为特征的帐号组。接着,我们基于少量训练数据,利用标签传递方法,对协作行为帐号进行分类,从而确定协作账号组。实验结果表明,该方法能够有效发现水军与傀儡帐号小组。4.本文的研究基于200万微博帐号的5年消息,整理了包含1.8万协作帐号及其消息内容、行为记录的训练数据集。通过实验,验证了所提方法的有效性,并为后续相关研究,提供了扎实的数据资源。综上所述,本文从营销和推广行为检测应用需求、协作行为发现、协作帐号与帐号组的发现这三个方面开展了研究,在一个统一的框架下,提出了两种协作行为和帐号发现方法,并通过海量真实数据上的实验,验证了方法的有效性。
其他文献
NASBA即核酸序列依赖扩增技术,主要用于扩增RNA,是由一对特异性的引物介导的、连续均一的、体外核酸序列等温扩增反应过程。该技术具有操作简便,特异性强,敏感性高,快速,高通
<正> 【处方】板蓝根六钱,夏枯草三钱,金银花三钱,甘草三钱。【用法】每日一剂,每剂煎二次,二次药液混合后,分三次服,连服三日。如集体发病,可按上述计量计算,集体煎服。
<正>近年来,证券公司或者其他主体以非法大量买卖和持有证券的形式"坐庄"、恶意操纵证券的成交价格和成交
孔子教育思想对人类尤其是我国教育有着深刻的影响。他的有教无类思想、对教育作用的认识以及启发诱导、因材施教等思想,都含有浓厚的民主思想和普世情怀。今天的教育有许多
目的:明确Lhx8过表达慢病毒在海马齿状回胆碱能神经元发生中的作用。方法:构建Lhx8过表达重组质粒、进行慢病毒包装,通过颅脑立体定位和微量注射的方法,将所得慢病毒Lenti6.3
基层中医院开展"治未病"工作对解决当前"看病难、看病贵"的问题、全面提高当前人口身体素质有着十分重要的意义;基层中医院开展"治未病"工作的内容应从"宣传养生知识、解决慢
愈演愈烈的"民工荒"和"涨薪潮"的背后其实隐含着深刻的人口问题,即我国无限供给的劳动力优势正在成为历史,支撑我国经济迅速崛起的人口红利也逐渐式微,人口结构的变化预示着
金融行业是经济发展中不可或缺的一部分,为追求企业价值最大化,人们越来越关注金融业自身资本状况。本文运用资本成本比较法分析金融行业上市公司的资本成本及其结构,并针对
社会经济不断发展,企业之间竞争逐渐加剧,企业想要进一步发展就必须充分利用现代化计算机应用技术,不断地提升企业信息化水平。正是由于计算机应用技术与企业信息化之间的密
本文采用组织学方法观察了江黄颡鱼(Pseudobagrus vachelli)原始生殖细胞(PGCs)的迁移、生殖嵴生成和性腺分化;用免疫组织化学方法,检测了对照组和各实验组鱼苗的脑和性腺组织