基于传播模型的社交网络潜在热点话题挖掘

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:talenthers312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的兴起,社交网络平台越来越多地被人们所熟知和运用。人们在社交平台上进行交流从而产生各种话题。本文主要是基于传播模型来挖掘社交网络上的潜在热点话题。我们首先设计并实现一种新颖的话题预测模型来预测潜在热点话题,然后我们基于上述模型提出了两种社交网络图上的点抽样方法来节省话题传播的空间和时间开销。基于社交网络的话题挖掘一直是一个重要的研究领域。许多研究关注从网络文本中进行话题挖掘,而忽略了社交网络的结构在话题挖掘中的重要作用。还有一些研究虽然关注网络中话题传播模型,但是并没有充分利用社交网络中丰富的属性信息,同时没有具体模型来研究社交网络中潜在热点话题的预测。本文设计并实现了一种新颖的话题传播模型算法(LHTP)来进行社交网络潜在热点话题预测,同时对话题预测效果的评估给出合适的参数和约束条件。并且我们在LHTP模型上给出了扩展模型LHTPEX,它能够在保证预测效果的情况下,降低程序的运行时间。不同于基于异构网络的话题预测模型,本文更加关注同构网络中丰富的属性信息。本文将模型应用到真实数据集,与TMBP模型进行比较,结果表现了我们算法的有效性和准确性。同时,在进行社交网络话题传播时,随着数据量的不断增大,传播模型在进行传播模拟时所花销的时间更多,程序运行所占用存储空间也更大。然而在实际的话题传播过程中,大多数话题集中在某些关键节点上,且相当一部分节点对话题的传播没有太大的影响。因此,如果在进行话题传播时,我们能够去除社交网络中的某些传播节点,这不仅能够减少程序的运行时间,而且能够降低数据所占用的存储空间。针对上述问题,我们设计了两种新颖的点抽样方法来减少社交网络中的节点数量。本文所提出的两种方法是将推荐系统的思想引入到社交网络传播模型的抽样方法研究中,具有一定的新颖性。通过实验分析,我们对比分析了不同抽样方法对传播模型的效果,所占空间,运行时间以及图的健壮性的影响。
其他文献
目前,基于统计的方法在机器翻译领域内占据着主导地位,出现了多种不同类型的统计机器翻译系统,如基于短语的系统、基于层次短语的系统、基于句法的系统等。不同类型的系统都
1553B总线具有高可靠性和实时性,在航空航天等领域得到日益广泛的应用,但是在关键领域其可靠性还有待提高。研制容错总线控制器系统是目前提高其可靠性的重要方法之一。故障注
随着计算机水平和通信技术的飞速发展,物联网在电子商务、电力监控、军事国防等机密领域的应用越来越广泛,信息的共享与交换占据着越来越重要的地位,随之而来的信息安全问题
P2P模式以其能更好的利用互联网中的计算能力、带宽、存储等资源,具有健壮性好、成本低、伸缩性强等优势,迅速地得到了广泛的推广和研究。本文遵循了结构化P2P的模型CAN(Cont
软件测试是软件质量保证的关键技术,在软件生命周期中占有重要的位置。测试过程是软件开发过程中一个单调、复杂和耗时的质量保障环节。近些年随着软件规模的扩大,软件质量的
当今世界,随着网络技术的发展和网络传播速度的大幅度增长,网络信息交流更加频繁,网络应用范围不断扩大,人们越来越依赖于网络,学习、工作、生活与娱乐活动都离不开网络。而网络安
随着人们生活水平的提高,人们对精神文化的需求越来越大,文化演出的数量也逐渐增大,因此对于文化演出的提供方来说前期演出的决策难度也逐渐增大;与此同时,现有的与文化演出
随着我国船舶工业的稳步快速发展,我国已跻身造船大国之列,但我国造船行业的总体制造效率较低。提高制造效率,缩短船台周期已经成为我国船舶工业发展的关键问题。  随着新工艺
变压器的运行状况直接关系到整个电网的安全。油中溶解气体能反映变压器的运行情况,但是,油中溶解气体分析(DGA)法只能对油样采集时刻的变压器故障情况进行诊断,不能对变压器存在的潜伏性故障进行预测。因此,对变压器油中溶解气体预测方法进行研究具有重要的理论价值和实际意义。首先,本文在分析现有变压器故障预测方法的特点及其存在问题的基础上,详细介绍了极限学习机的基本理论及其算法,并将其用于变压器故障预测中,
为了加强对国土资源的管理和利用,促进经济可持续发展和社会的全面进步,迫切需要科学、及时地对国土资源利用情况进行动态的监测。遥感技术以其快速、准确、周期性短等特点在国土资源管理中具有明显的优势,研究和开发遥感卫星监测平台对国土资源利用情况进行动态监测已经成为了热点。变化检测作为遥感卫星监测系统中的关键部分,一直以来被广泛研究。在对目前常用的变化检测算法进行归纳总结和比较分析的基础上,本文重点研究了基