基于团体信息的微博传播趋势预测的研究

来源 :上海师范大学 | 被引量 : 1次 | 上传用户:ivy1128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博已经成为一种信息获取的重要途径和信息传播的载体,微博上的虚假信息的大量传播可能会造成恐慌,因此有必要对微博中相关的舆论话题进行监管。准确地预测微博的传播趋势有助于提前对舆论进行干预,并采取合理的管控措施,使其朝着积极的方向发展,使微博更好的服务大众。传播趋势预测在舆论监管、政府宣传、广告投放、票房预测、热点推送和企业营销等领域有着广泛应用。一方面,传统的微博传播趋势预测方法通常只关注微博自身内容的个体特征,忽略了微博传播过程中时空背景环境等变化的动态特征,导致微博特征描述不准确的问题,无法准确地对微博进行建模。微博传播网络是一个动态的社交网络,转发者作为微博的传播动力,使得微博在传播过程中信息得到了补充,故而预测任务也应该考虑传播过程中产生的新的特征信息,即考虑用户团体信息。另一方面,传统方法通常忽略微博传递过程中的用户的情感态度信息,转发者的情感信息是一种很重要的特征,其可以体现作者的观点看法。现有研究表明通常带有情感的评论更可能影响其他用户,用户情感特征也是影响传播规模的因素,情感在网络中传播时,带有情感的微博普遍比不带情感的微博传播范围更广。目前大多数研究者只关注微博的传播规模,缺少对社交网络传播过程中的情感变化动态趋势的研究。本文以新浪微博为研究对象,对微博传播过程中的转发趋势和情感趋势变化进行研究和预测。主要有两部分工作:第一部分,本文提出了一种基于时序变化的微博团体信息提取方法来解决微博特征描述不准确问题,并进一步利用团体信息预测微博转发量来验证该方法。第二部分,提取用户的情感特征,并结合提出的微博特征表示方法对大众情感变化趋势和转发量进行联合预测。具体工作如下:1.首先提出一个基于团体信息的微博信息描述方法及转发数预测算法,解决不同时刻背景信息下微博特征表示不准确问题,团体信息主要包含常用的个体特征、团体影响力特征和转发评论特征三个方面,其中常用特征主要包含用户的注册年限、粉丝数、关注数等等;团体影响力特征代表微博当前转发时间链上的用户的所有影响力大小,通过计算用户的PageRank影响力值后累加得到团体影响力;转发者评论特征包含背景信息,是对源微博内容信息的补充。通过基于簇的关键信息提取,提取出包含关键信息的评论,利用Dilated CNN网络提取和压缩评论特征向量。将上述的三种微博特征作为微博的团体特征,将团体特征作为LSTM预测网络的输入。利用LSTM网络来进一步学习隐藏特征和时序特征并进行转发数预测。2.基于上述微博特征提取方法之上,对微博进行情感分析,考虑情感特征变化,提取用户情感特征,将情感特征和团体特征相结合,进行转发数和情感趋势的联合预测。在预测转发规模的同时,预测情感趋势变化。通过联合预测建立了传播规模和情感趋势之间的联系,模型在预测微博传播规模的时也关注用户团体的情感趋势变化。实验结果表明,本文提出的方法与传统的机器学习方法相比,在大多数评价指标上有所提升,在传播规模和情感趋势预测上都表现出较高的性能
其他文献
近年来,随着我国经济社会的全面快速发展,工业化和城市化进程的不断推进,大量的农业用地流转为城市建设用地,在极大的促进社会经济发展的同时,也带来了生态环境污染严重、农
现代陆地通信技术已十分成熟,而水下通信技术的发展空间更大。实现稳定的水下通信的前提是明确通信双方的位置信息,因此定位系统对于水下通信的发展至关重要。考虑到水流的侵蚀作用,水下通信技术多是基于无线技术发展前进,在多种多样的水下无线通信技术中,水声通信和光学通信是两个主要分支。水声通信技术发展比较成熟,但是随着人们对海洋资源勘探力度的不断加大,对海洋资源需求的不断增加,水声通信的低码率、窄带宽特点已经
目的从人骨骼肌组织中分离培养血管外膜细胞(pericytes/perivascular cells,PCs)并进行生物学特性鉴定,探究其对人脐带血(Umbilical cord blood,UCB)CD34+细胞的体外支持效力。方法1.利用多参数流式细胞术(multiparameter fluorescence-activated cell sorting,MP-FACS)从人骨骼肌中分选表型为C
软件定义网络(Software-Defined Networking,SDN)将传统网络设备的控制面和数据面分离,让网络设备只保留分组转发等数据面的功能,而将控制面的功能放到一个集中式的控制器中。这种分离使数据面和控制面可以独立地发展,有利于网络功能的创新。在SDN的架构中,管控网络的功能由控制器中安装的应用来实现,因此可以灵活地处理网络中发生的事件(如新流到来或链路故障等),还能在控制器运行时动
由于温室效应和能源短缺等世界性问题日趋严重,采用高强轻质合金代替传统钢材以实现汽车轻量化是大势所趋。6061铝合金因其具有较低密度、中等强度、良好的塑性和耐腐蚀性而
本文研究了新视界第一定律是否仍然适用于f(R)引力。在广义相对论中,由新视界第一定律,可以得到静态球对称黑洞的熵和能量。推广到f(R)引力,考虑物质的最小耦合,对作用量作变分,得到引力场方程。在静态球对称时空下,假设视界上的状态方程形式,把f(R)引力的径向场方程写成两部分的组合,其中一部分包含温度项,另一部分则不包含温度项。在视界上,假设视界半径微小的变化,可以得到新视界第一定律的微分形式,进而
随着光伏接入电网的比例不断增加,其随机波动性对于电网供需平衡及安全稳定的影响也愈发严重,直接影响到电能质量以及光伏能源的有效消纳。通过对光伏功率输出量进行预测,对电能供应提前进行调度,可以保证供电侧与负荷侧的功率平衡,减小光伏发电波动对电力系统稳定运行的影响。目前,神经网络仍是最为常用的光伏功率预测方法之一,但传统的神经网络预测模型主要使用离线学习模式,依赖离线历史数据训练的模型投入在线运行后不再
近年来存储与计算能力出现的爆发式增长让人们相比以往能够更全面、更实时的获取信息数据。提供更便捷、高效的服务的同时也生成了数量庞大的数据信息。将海量数据转化为业务需求的极高的困难性,对各个领域造成巨大的冲击性。在安全领域更是带来更大的变革,传统的网络安全防护需要依靠安全专家自身知识领域的广度与深度。但随着安全漏洞层出不穷、攻击利用方式多种多样,依赖于专业人才的安全防护方式已经不能满足需求,人们开始着
Schr(?)dinger方程是揭示微观物理世界物质运动的基本规律的方程,1925年,由奥地利物理学家Schr(?)dinger建立的,它是量子力学的基本方程.本文主要考察两类初值条件的分数阶导数的
非线性偏微分方程在描述非线性现象中具有重要的作用,目前已在力学、物理化学、工程技术及大气科学等领域中广泛应用.由于非线性项的存在,使得非线性问题的解析解难以得到或