社交网络中影响最大化研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xxq0108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
这是一个非常有挑战的任务:在社交网络中发现一个大小为的节点集合作为初始目标种子集合来最大化影响力。这个问题被证明是一个NP-hard的问题。但是幸运的是影响力函数()具有次模属性,使得基本的贪心算法可以得到优化解的()近似。但它的速度很慢,所以首先我们提出三个算法来解决这个问题:(1)我们优化基础的贪心算法,把信息的传播限制在一个邻居区域来减少运行时间。我们使用DAG和递归方法来计算每个节点的影响力;(2)并且我们也把这个问题转化为一个不确定图中的可达概率查询的问题;(3)我们提出了一个更为精确的考虑了节点和它的一步邻居之间关系的度折扣启发式方法。然后我们使用Hadoop对于上述三个算法进行了并行化和其他优化:(a)对于集合的影响力计算分割并行化为成员节点的影响力计算;(b)对于多次独立的取样本过程进行并行化,并且将并行过程从根节点下放到左右子节点,将并行粒度进一步变细。将搜索过程从DFS改为双向的BFS过程,避免数据溢出,加快搜索速度;(c)进一步扩大步长,按照(3)的方法推算出考虑了二步邻居时的节点相对影响力,并且提出了一种可以考虑更大步长的新的可行方法。在现实世界的大规模社交网络上的集中实验显示出了:我们的优化的贪心算法和度折扣启发式算法是比基础的贪心算法和其他启发式方法更加有效的。并且并行和优化充分利用了集群的计算能力,很好的提高了算法的效率和精确性,从而使得我们的算法更加适应于大规模的社交网络图数据集。
其他文献
随着科教兴国战略的实施和教育体制改革的不断深入,我国高等教育得到了突飞猛进的发展。在这种形势下,各高校为了提高教学质量投入固定资产的金额不断增加,使得高校的资产房
当前,云计算、云存储技术正在飞速发展。由于网络服务带宽吞吐率直接影响着云计算云存储的用户体验,所以人们在使用云计算云存储的过程中,非常重视云计算云存储提供的网络服务带
蚁群算法因其具有分布式计算、信息正反馈和启发式搜索等优点,已经成功地应用于解决各类复杂优化问题,然而蚁群算法中收敛早,易陷入局部最优等缺点也一直存在。聚类分析是数据挖
随着公共安全问题的日益突出和视频数据的爆炸式增长,智能监控逐渐成为计算机视觉的一个研究热点。针对超市监控中的盗窃现象等人体异常行为进行分析和检测,不仅能够减轻监控
医学图像分割在医学研究、临床诊断、医学图像三维重建和可视化、计算机辅助手术等领域中有着广泛的应用和研究价值。所谓医学图像分割,就是根据医学图像中的某种相似性特征,
传统的RFID防碰撞算法在处理碰撞时,阅读器发送数据的传输总次数和传输总位数都比较多。为了更好的解决在多标签环境下标签上传数据的碰撞问题,本文对以往的防碰撞算法进行了优
在汉蒙统计机器翻译方法中最流行的是基于短语的汉蒙统计机器翻译方法,而该方法有它自己的缺点,即长距离调序能力较弱,另外,短语长度扩展到3个以上时,出现非常严重的数据稀疏问题,
随着通信业务需求的不断增加,网络规模不断扩大,网络结构日益复杂,导致基站网络故障告警也越来越繁多。大量的无关告警把真正的故障告警淹没,导致故障的发现、定位以及排除变
随着信息化的发展和大数据时代的到来,传统的数据存储方式已不能满足现代数据存储的需求,而云存储和海量数据存储被视为是下一代数据存储的良好解决方案。所谓的云存储,是指通过
以太网光纤通道(Fibre Channel over Ethernet,FCoE)可将光纤通道(FibreChannel,FC)信息封装到以太网信息内,光纤通道请求和数据可以通过以太网传输,是一种利用以太网实现高效块存储