论文部分内容阅读
随着网络的普及与发展,虚拟社会逐渐渗透进人们的生活中,出现了很多大型社会网络在线网站如facebook、twitter、新浪微博等,人与人之间透过这些虚拟网络相互产生影响和互动。社会网络中个体之间的影响力能影响用户的行为以及社会动态,而个体之间的影响力分析与挖掘又是其中一个关键问题,对影响力进一步研究能够改进很多应用例如病毒式营销、推荐或信息检索等系统的功能效率,增加应用的准确性。然而,目前大多数已有的关于社会影响力的研究都集中于验证社会影响力的存在性,缺乏对社会网络中直接或间接影响力强度的研究,这导致无法定量的给出社会网络中成员节点之间的影响力大小或强度。针对这个问题,本文研究了社会网络中的影响力挖掘相关方法,论文的主要研究工作和创新点包括以下内容:首先,提出一个主题发现方法ToFiM。该方法利用LDA生成模型发现有影响和被影响用户的兴趣度分布,为后续的影响力挖掘方法提供基础。然后,研究和实现一种面向主题的影响力挖掘方法ToiMM。在给出影响力挖掘问题的形式化描述和相关定义基础上,针对社会网络中的不同类型节点属性和不同节点关系,挖掘节点之间的直接/间接影响力强度。ToiMM方法被分为两部分进行研究:1)利用有影响用户和被影响用户的兴趣度分布来挖掘节点间主题层的直接影响力强度;2)基于已学习到的直接影响力强度,使用两种不同的影响力传播和聚合的机制:保守影响力传播机制和非保守影响力传播机制来获取节点间的间接影响力强度。并进行了算法的分析,给出了一个应用实例说明。其次,设计和实现实验以验证上述方法的有效性。并在Twitter和Citation两个网络数据上的实验结果证明ToiMM方法的可行性和正确性。最后,基于上述的影响力挖掘方法的研究,针对电子商务应用领域,提出一种用户回买行为预测模型BBModel和相应的用户回买行为预测方法,并设计和完成实验以验证所提模型和方法的可行性和有效性。