论文部分内容阅读
近年来随着互联网浪潮的兴起,社交网络凭借着其内容的丰富性和信息的即时性迅速成为人们交友和合作的平台,同时也掀起了一系列围绕社交网络的学术研究来挖掘有价值的信息。在这些学术研究中,较为重要并引起广泛讨论的话题是关于社交网络影响力的分析。通过对社交网络进行影响力优化和预测分析能够帮助我们发现具有影响力的用户以及理解信息如何进行传播扩散,并应用于专家发现,产品营销等实际场景中,从而提高对社交网络的利用和管理能力。因此,本文从社交网络中的影响力优化和预测研究出发,分别从个体影响力预测层面和群体传播影响力优化层面进行探讨。本文具体研究工作如下:第一,在个体影响力预测方面,本文选取了社交网络中的典型代表--学术社交网络进行个体影响力的预测研究。考虑到衡量学者学术影响力在实际中具有重要价值,同时学术影响力的度量方式和预测方法仍然不够完善,本文选取了较为公平的指标G指数对个体学术影响力进行度量,同时首次提出了如何在给定时间间隔下对G指数进行预测研究这一问题。为了求解该问题,本文首先基于学术社交网络结构抽取了不同的特征指标。然后,利用这些提取出的特征指标引入了基于深度学习的预测模型进行求解。最后,本文基于真实的学术社交网络数据集进行仿真验证,证明该问题具有可解性。大数据分析结果表明未来G指数与当前学术社交网络的特征有关,即未来G指数与学者的当前G指数、论文引用量的平方根、论文数量存在正相关关系,与局部群聚系数存在负相关关系,而研究年限、论文平均引用量、平均合作次数等因素与未来G指数的关系不大。除此之外,实验结果表明本文所提出的基于深度学习的预测模型相对于常用的机器学习模型具有更好的预测效果。第二,在群体影响力优化方面,考虑到现有的影响力优化问题无法满足真实场景的需求,本文首次提出了一种新的影响力优化问题,即竞争环境下的影响力优势最大化问题。该问题的目标为使得己方产品在市场中占有更多份额,即通过一定的策略选择k个初始用户,从而最大化己方影响力与竞争对手影响力的差值。为了解决该问题,本文提出了一种考虑了时间限制,时间延迟和按比例概率激活的传播模型。在该传播模型下,目标问题是一个NP-Hard问题,但本文证明该问题具有子模性和单调性,因此可以构造贪心算法求解该问题且保证1-1/e的精度。进而,为降低贪心算法的复杂度,本文提出算法对目标问题进行求解。最后,通过在四种不同的真实网络数据集上的实验,验证了本文提出的竞争影响力优势最大化问题具有可实施性,而且通过与经典的启发式算法作对比,证明了本文所提算法的性能远远优于度最大化算法和随机算法两个基本的启发式算法。