论文部分内容阅读
随着互联网的发展,社会网络已经成为人们生活中的重要组成部分。进一步的,社会网络的发展呈现出多维社会网络共存,进而交叉融合的趋势。在多维社会网络上的信息挖掘问题具有重要的学术意义和应用价值。然而现有的社会网络信息挖掘问题均是在单维社会网络上进行,传统的应用在单维社会网络上的信息挖掘算法和模型难以适用于多维社会网络场景下的信息挖掘问题研究。本文将聚焦于多维社会网络上的信息挖掘问题展开研究。主要工作如下:第一,基于传递相似性的多维社会网络信息推荐。目前多维社会网络信息推荐面临的主要问题是数据稀疏性和冷启动等数据缺失问题,同时多维社会网络的各个维度上又蕴含着丰富的信息,只是尚未发现可以有效的综合利用这些信息的方法来缓解数据缺失问题,从而加强推荐效果。本文提出一种基于传递相似性的多维社会网络推荐算法,以各个维度的社会网络之间的交叉用户的信息作为纽带,利用其他维度网络上的信息来加强目标社会网络上的推荐效果,解决了目标社会网络上的数据稀疏性问题和冷启动问题。同时提出了一种相似性加速计算算法,该算法利用很小的空间复杂度开销,换来时间复杂度上的大幅度减小。从而使得该算法更加具有实际应用的意义。在真实的多维电商社会网络上进行实验,验证了该算法的有效性。与传统的基于用户相似性的推荐算法相比,该算法在推荐精度上有一至两倍的显著提高。第二,多维社会网络上基于时间特征的信息传播预测。本文综合考虑关注关系网络、消息转发网络、时间这三个维度对于社会网络中信息传播概率的影响因素,提出了一种基于时间特征的信息传播概率预测模型。该模型在考虑关注关系网络的拓扑结构这一静态因素的同时,创新性的引入了消息转发网络上时间维度上的特征。在推断过程中对模型参数引入先验概率,并采用最大化后验概率框架对进行模型推断和参数学习。最后在微博数据集上进行实验,以验证该模型对于信息传播的预测效果。结果证明该模型与其他主流信息传播预测模型相比,具有更好的预测准确性,并且能在训练样本较小的情况下,保持很高的预测准确性。