基于无拓扑结构的社交消息传播预测方法

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:ebear2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,网络已经成为人们生活的一部分,越来越多的人在享受网络带来的便利。人们通过社交网络平台分享和获取各种消息。准确的预测社交网络中信息的传播范围十分重要,该问题也在数据挖掘领域中被广泛关注。目前大多数研究利用社交网络拓扑结构和用户消息传播时的动作日志预测消息的传播范围。宏观上,使用消息传播不同时刻的变化过程预测消息传播范围;微观上,使用用户网络拓扑结构和消息传播过程预测消息的传播范围。而在实际应用中用户的动作日志容易获得,而社交网络用户拓扑结构和消息的传播结构并不容易获得。因此无拓扑结构的社交消息预测具有更广泛的应用前景。本文提出3种方法预测无拓扑结构消息传播范围预测方法。(1)NT-EP(non-topology message propagation)方法首先利用消息传播随时间衰减的特性构造消息传播结构加权图,使用随机游走策略获取多条消息传播路径。其次,将消息传播路径放入Bi-GRU(bidirectional gated recurrent unite)中,结合注意力机制计算出目标消息的传播特征向量。然后,通过梯度下降方法计算出其他消息对目标消息的影响向量。最后将目标消息传播向量与其他消息影响向量结合预测消息的最终传播范围。在Sina微博和Flixster数据集上的实验结果表明:NT-EP方法在均方误差(mean squared error,MSE),F1-score等多个指标都优于现有的社交消息传播范围预测方法。(2)NTG-EP(non-topology graph message propagation)方法首先利用用户间的影响构造加权图,并从中随机游走抽取多条信息传播路径。其次,根据用户的影响关系,刻画用户的影响向量。然后,根据用户的影响向量和构造的用户之间的影响加权矩阵计算目标消息传播时的用户影响向量。最后,根据参与目标消息传播的用户向量计算目标消息传播向量,并根据目标消息传播向量预测消息的传播范围。NTG-EP方法从消息发生开始到预测消息传播范围,所需要采样数据的间隔更短。在Sina微博和Flixster数据集上的实验结果表明:NTG-EP方法在均方误差的评价指标优于现有的社交消息传播预测方法。(3)NT-TP(non-topology time propagation)方法首先根据消息传播过程中的不同时刻的动作日志构造加权图,并从加权图中提取多条消息传播路径。其次根据用户的历史影响向量和构造的加权传播图,计算参与消息传播的用户的短时间影响向量。然后,根据消息不同时刻的用户短时间影响向量构造消息不同时刻的消息传播向量。最后根据消息不同时刻的消息传播向量,按时间发生顺序放入LSTM中预测消息传播范围。NT-TP相比于NT-EP方法和NTG-EP方法采样动作日志的数量更少,预测消息传播所需要的时间更短。在Sina微博和Flixster数据集上的实验结果表明:NT-TP方法在均方误差的评价指标优于现有的社交消息传播预测方法,并且预测消息传播范围所需要的时间更短,时效性更强。
其他文献
现代职业教育的发展基础离不开实训中心的建设,尤其需要实操技能的职业教育。教育装备作为实训中心建设的核心,在职业教育发展的过程中既是技能传递的媒介,也是教学实施的保障,同时也是我国职业教育实现双高和1+X的重要保证。因此,研发生产先进的教育装备与课程创新是关系到国家职业教育未来发展的重要课题。基于对当前公司发展战略研究现状的分析,本文对公司发展战略的研究路径进行深度梳理,在装备和培训服务领域产、销、
内蒙古位于我国北部边疆,具有独特的自然生境和丰富的自然资源,是我国北部重要的生态屏障。陆地植被对陆气相互作用乃至全球气候变化起着至关重要的作用,内蒙古地区植被长势的时空分布、变化趋势监测及其驱动机制对该区生态环境评价和保护具有重要意义。本文基于MODIS遥感数据构建植被长势指数(GI)模型,分析了内蒙古2001-2017年森林生态区、草原生态区和荒漠草原生态区植被长势的时空变化特征;结合研究区气温
HM食品有限公司是一家以速冻食品、熏酱制品生产、配送、销售于一体的中型民营深加工企业。本文运用文献检索法、实地调查法、理论与实际相结合等研究方法对HM公司营销现状进
作为实现完整股东权利的前提条件,股东知情权是股东维护自身利益的重要手段。股东查阅权是以积极方式主动行使知情权的表现,因此以法律条文明确股东查阅权是十分必要的。但现代企业制度不断完善,公司独立人格被普遍认可,公司利益同样需要受到保护,所以股东在行使权利时也要受到一定约束。股东账簿查阅权是知情权的非常态形式,仅应当在公司信息披露不充分等少数情况下采用。故通说认为股东账簿查阅权是一种相对权利,各方面都要
随着我国工业生产技术不断发展,包含机械臂的自动化的技术在流水线应用越来越广泛,主要用于工件的搬运、抓取等生产行为,对机械臂的配置也越来越智能化。本文设计了基于视觉机械臂抓取系统并进行相关实验验证。该系统作为一种小型的抓取系统,对研究工业生产中应用机器视觉抓取系统具有重要意义。它主要包括两个模块,一是Open MV视觉模块,该模块用于捕获传送带上的运动立体物体并进行图像处理,获取物体的中心点坐标;二
土地资源对于支撑人类社会的生存和发展至关重要。随着城市化进程的加快和经济社会的快速发展,人口数量增多、水资源短缺、耕地减少、资源开发过度、环境污染等问题层出不穷,这些问题给城市领域的土地系统带来了巨大的承载压力,甚至使土地出现超负荷状态。因此对土地综合承载力的研究不仅对实现土地可持续利用及合理制定城市发展规划具有重要的指导意义,同时也为人类社会的可持续发展规划提供了重要的参考依据。本文根据资源稀缺
西秦岭是中国重要的地理分界线,具有极其繁杂的构造演化历程。是我国重要的贵金属、有色与黑色金属矿产集中区。金矿是该区的优势矿种。其中,阳山金矿带位于西秦岭造山带南亚带,南秦岭微陆块和碧口地块之间的勉略缝合带内,该金矿带自西至东依次分布着泥山、葛条湾、安坝、高楼山、阳山及张家山等矿段。葛条湾矿段主要出露的地层有下泥盆统桥头岩组(Dq)和屯寨岩组(Dt)。其中,桥头岩组(Dq)为主要的赋矿地层。矿段位于
脑心肌炎病毒(Encephalomyocarditis virus,EMCV)属于小核糖核酸病毒科心病毒属,是一种无包膜单股正链RNA病毒。EMCV不仅可引起心肌炎和脑炎,还可引起多种哺乳动物的神经系统疾病、生殖障碍和糖尿病。EMCV宿主范围广,猪是其易感动物,可引发仔猪急性心肌炎和妊娠母猪胎儿死亡或流产,给我国养殖业带来很大经济损失。然而,不同毒株EMCV毒力和致病性存在显著差异,其致病机制尚不
埋地塑料管道随着埋深的不断增加、温差的变化、自身抗力的衰退,在外部力量的作用下,导致管道超过了其所能承受的承载力,进而出现问题,这是一个不可逆转的缓慢灾变过程。因此需要对塑料管道的应力变化进行研究、试验,对管道的性能进行评价,指导科学合理施工,提高塑料管道的可靠性和稳定性。本文根据埋地塑料管道的测试需求,根据其特点研究设计了一套埋地管道土壤实验室,同时选取了钢带聚乙烯螺旋波纹管作为研究对象,对管材
在各个经济行业中,对推动我国国民经济发展和技术领域进步具有基础作用和重要地位的是大型装备制造业,它对促进国家经济的稳定发展有着重要的保障作用。由此可见,大型装备制造企业的经营效率和业绩如何将直接影响国民经济的表现。自2010年以来,国务院国资委逐步将经济增加值(Economic Value Added,以下简写为EVA)作为一项重要指标引入到中央企业绩效评价中,旨在督促中央企业提高资本使用管理水平