论文部分内容阅读
信息技术的发展促进了现实人类社会与虚拟网络空间的深度融合,人们在信息化环境中留下的数字足迹汇聚成多种多样的关系网络。迅速积累的海量交互数据蕴含着巨大的商业价值和研究价值,对社会网络进行分析、挖掘,揭示数据背后的规律已成为许多研究人员关注的课题。社区结构作为社会网络最重要的拓扑属性,具有同一社区内部的节点间联系紧密,而社区间的节点连接稀疏的特点。网络中社团结构的检测有助于揭示复杂网络的层次结构,全面透彻地分析节点间的社会关系。另一方面,社交网络的研究也促进了广告推荐、精准营销等业务的发展,借助用户间的社交关系网络,有助于缓解推荐系统中的数据稀疏性、冷启动等问题。针对如何有效地挖掘出具有实际意义的社区结构,以及如何利用社交网络改善传统推荐系统的性能等问题,本文进行了深入的研究,取得的研究成果如下:1.现有的社区发现算法大多将焦点集中在节点的聚类方法上,忽略了对节点间关系的研究,而节点间相似度的定义同样影响着社区检测的性能。对此,本文在模块度谱分析算法的基础上,提出一种基于近邻关系迭代更新的社区检测模型。以一种自学习的方式,通过多次迭代修正网络的关系矩阵,使其更精确的刻画节点间的关系,从而提高算法社区划分的性能。2.社会网络中实体间的关系往往是多元化的,针对多关系网络社区检测,本文提出一种基于异质关系间共享局部结构的社区挖掘算法;该模型将网络节点的聚类分两个阶段进行:首先通过提取多种关系间的共享局部信息,对网络中的节点进行了局部划分;然后,基于划分出来的社区子集,定义一种节点簇的凝聚度函数,并按照凝聚度增益最大化的原则将待划分的节点的依次归类。3.为了缓解协同过滤推荐技术中存在的稀疏性问题,本文借助用户间的社交关系网络,提出一种融合社会关系网络的协同过滤推荐算法。模型中,我们同时考虑了用户实际行为与社交行为的同质性(一致性)和异质性,并将两个方面融合到了矩阵分解的框架当中。其中,通过联合分解评分矩阵与社交关系矩阵得到的用户共享潜在因子,实现了用户社交信息的有效迁移。在豆瓣等数据集上的实验结果验证了所提模型的有效性。