论文部分内容阅读
随着社交网络的迅速发展,改变了人们生活和交往的方式,同时也为违法犯罪提供了新的作案形式。通过对非法目的团伙内部人员和团伙内部社交关系进行准确、有效、及时的分析,可以迅速定位目标人物及群体。但是社交网络错综复杂,信息分散且不准确,很难对一个虚拟网络账号背后的社会实体进行定位。因此,通过对社交网络大数据挖掘分析,设计并实现基于用户画像的群体发现系统具有重要的理论意义和应用价值。本文首先通过对用户画像模型的研究,发现社交平台上不同来源的用户数据蕴含了不同的特征,且目前的用户画像模型分别针对不同的任务进行预测,忽略了各个属性之间的关系。因此,本文提出了多源多任务用户画像模型。利用深度学习融合多源异构社交数据信息,全面挖掘隐含在多种社交信息中的有效特征。从性别、年龄、地区、教育程度、主题等多维度对用户进行全面描述,同时利用各个属性之间的联系,构建了多任务学习框架。实验表明,该模型在真实数据集上多个任务的平均准确率可达83%。其次,本文通过对群体发现算法的研究,发现目前的群体发现算法通过社交网络结构进行群体划分,忽略了用户节点自身的属性,或者通过用户属性相似度聚类进行群体划分,而忽略了社交结构这一重要特征,且用户的属性众多难以全部列举。因此,本文提出了基于用户画像的群体发现算法。首先基于用户画像共享层中的融合向量计算出用户综合相似度,然后基于综合相似度找出每个节点最相近的k个节点,重新构建加权网络结构图,最后通过本文提出的W-Louvain算法进行群体划分。实验表明,该算法在各项评估指标上均优于其他算法,能够将既在结构上紧密连接又在属性上极其相似的用户划分到同一个群体。最后,本文通过对社交网络大数据的挖掘与分析,设计并实现了基于用户画像的群体发现系统,形成一套有效的对特定人员及其群体进行特征收集和分析的应用系统。经测试和应用表明,本系统性能良好,功能满足了需求。