大规模网络传播行为中的关键问题研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:suncj007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的发展特别是移动互联网的加速推广,网络迅速渗入到人们日常工作和生活的各个方面。社交网络尤其是微博的快速发展,逐渐替代了传统媒体成为网民获取新闻事件和分享信息的主要媒介。在大规模的社交网络中,其自组织性和庞大的节点规模徒增了网络中信息传播演化的复杂性和随机性,使得传统模型和研究方法难以准确描述用户微观交互行为,也难以解释网络中信息传播和演化的宏观过程,致使大规模网络中信息传播过程的分析成为研究的一个难点和热点。鉴于此,本文使用交叉学科的思想和方法,对微博网络信息传播建模、信息传播趋势预测、突发时间预测、用户传播影响力评价等传播行为关键问题进行了深入研究,旨在发现大规模网络中信息传播行为的微观和宏观规律,建立信息传播模型,对信息传播过程中用户的影响力进行评价,并寻找对信息传播趋势和突发现象的预测方法。本论文有助于了解大规模网络中信息传播和级联演化的过程,通过对影响力分析和传播趋势预测,为信息传播控制、传播趋势评估、突发事件预警等问题的研究提供有力的理论支持。本文的主要工作包括以下几个方面:  1)对微博网络中的信息传播行为进行测量和建模研究,提出了一种新的话题传播模型TP-Model和一种信息级联演化模型TCM。基于新浪微博的匿名数据集,对影响信息传播的网络拓扑特征、用户行为特征以及信息传播的级联特征进行了测量分析。在此基础上,提出了TP-Model模型研究热点话题的传播过程,并通过真实大规模微博网络上的仿真实验,验证了TP-Model对大规模热点话题传播过程仿真的有效性。考虑信息传播的时间相关性,提出了基于生存分析理论的时问感知级联模型TCM,建立了信息转发的时间相关风险函数,并通过参数估计和级联生成迭代,对信息级联的演化过程进行建模。仿真实验验证了TCM能够准确模拟信息级联的动态演化过程。两种模型有助于进一步认识微博网络中信息传播过程和信息级联随时间的演化,也是后续研究信息传播预测工作的必要前提。  2)对微博网络中信息传播的趋势进行了预测研究。针对热点突发话题传播过程的预测问题,提出一种基于异步独立级联模型的TAIC模型,将宏观传播趋势的预测转化为微观层面对单个传播实例的二分类问题。通过对传播过程的社交特征、内容特征以及时间特征等进行量化分析,基于决策树分类,提出了对传播实例和时延参数的预测方法。实验表明TAIC模型能够成功预测话题相关微博数目在后续天数的变化情况,该研究能够应用于社交网络中的信息推广和舆论导向等实际工作中。  3)对微博网络中信息级联演化的突发时间进行了预测研究。通过分析信息级联突发现象的模式,提出了一种基于优化加权随机森林分类的突发时间预测方法;针对信息级联演化中突发现象、突发时间窗口以及突发期尖峰窗口等三个渐进的预测问题,给出了基于时间窗口粒度的预测方案;通过对真实数据集中的突发时间预测实验,验证了预测方案的有效性。对信息级联演化中突发时间的预测研究为网络舆论突发事件的预警提供了有效支持。  4)对微博网络中用户传播影响力的评价进行了研究。通过综合考虑转发时间、用户所在传播级联结构以及用户间的交互等影响因素,提出了一种基于随机游走模型的算法SIRank,来计算不同用户的信息传播影响力,基于微博数据集进行了影响力评价对比实验,对高影响力用户进行排序和对比,验证了SIRank算法的高效性。通过对用户传播影响力的评价,研究工作能够进一步应用于社交网络中关键传播者发现等工作。
其他文献
社交网络服务(SNS)通过互联网支持人们之间的沟通。然而,用户的SNS朋友可以透露关于用户的敏感信息。这使得用户与不同群组的朋友分享信息不安全。此外,披露用户信息的朋友难以
近年来,机械故障智能诊断系统的研究成为机械故障诊断领域的研究热点,而系统的智能化程度和诊断准确度依赖于系统知识库中知识的数量与质量以及知识的组织、分类以及更进一步的知识共享和推理。本体作为一种能在语义和知识层次上描述知识模型的建模工具,可以提供对某一领域的概念以及相互关系的概念化描述,为知识共享奠定基础,本体支持对知识信息的区分,可以实现对领域知识的层次化表示,本体中包含的类公理以及约束公理可以用
数控技术在制造业中占有重要地位,而开放式数控系统是目前数控技术的发展方向.开放式数控系统对外提供的功能主要是运动控制和离散逻辑控制的功能,在开放式数控系统发展之初
解决并行算法中的数据分配问题,目前采用的主要方法是在各个计算结点上平均分配数据。如果并行系统是同构的,采用这种方法设计的算法具有很高的运行效率。但是在异构系统下,由于
多数据库系统屏蔽了不同数据库在物理上和逻辑上的差异,使用户能实现对异种数据库的透明访问.我们提出和研究的多数据库中间件实际上是构造"DBMS Over DBMS",是多数据库的一
智能规划是人工智能研究领域近年来发展起来的一个热门分支,由于其广泛的实用性,受到研究者的高度重视。尤其是具有不完全信息和不确定信息的规划问题已经成为智能规划中的研究
随着科技的发展,语音技术越来越受到人们的关注.语音合成作为言语工程的一个重要组成部分,已经成为当前研究的热点.语音合成系统将输入的文本信息以语音的形式输出出来,使信
随着Web服务的蓬勃发展,越来越多的组织机构将Web服务引入他们的业务流程.传统的工作流系统已经不再能满足业务集成的需要,新机制的工作流系统必须提供对Web服务的支持.工作
电子政务建设是中国当前信息化建设工作的重点,而信息安全是电子政务建设实施的关键,访问控制是整个电子政务安全服务中的核心.工作流技术广泛应用于电子政务系统中,但工作流
随着分布式计算技术的迅速发展,企业的商务活动和政府的政务活动将越来越多地依靠Internet。传统的分布式对象模型CORBA、DCOM、RMI不适用于极端异构的Internet环境。Web服务