论文部分内容阅读
随着信息技术的迅猛发展,新兴的社会网络为人类交流、信息传播、知识共享提供了完善的沟通平台,对人们的生活和行为方式产生了显著影响。社会网络用户可以随时随地参与到信息的创建和传播过程中,使得信息资源数量急剧增长。如何有效地组织和分析浩瀚的社会网络、准确获取网络用户的兴趣偏好以及根据用户的个性化需求给出高质量的信息推荐,成为了数据挖掘领域的研究热点。本文将网络社区发现引入到用户兴趣建模技术中,首先研究在社会网络中有效地发现社区单元,进而在网络社区的背景下基于社会化标注数据对用户群体兴趣进行建模,最后通过用户之间的关系挖掘与分析为用户个体提供高质量的信息推荐。论文的主要研究成果如下:(1)传统基于非负矩阵分解的社区发现算法需要优化模块度来确定社区数目,导致较高的计算开销和分辨率限制问题,为此提出了一种基于贝叶斯非负矩阵分解的重叠社区发现算法。首先,分析网络特征矩阵对社区发现性能的影响,选择扩展化邻接矩阵作为算法的输入;然后,引入贝叶斯非负矩阵分解模型,实现社区数目的有效迭代求解;最后,定义社区隶属度指数以及设定合理阈值,得到网络重叠社区划分。在计算机合成网络与真实社会网络上的实验表明,该算法可以有效地揭示社会网络中的重叠社区结构。(2)针对社会化标注数据的稀疏性与传统兴趣建模方法的局限性,利用社会化标签的独特优势,提出了一种基于社会化标注的社区群体兴趣建模算法。首先,采用将标签推荐与新标签提取相结合的方法对未标注文档自动添加标签;然后,根据标签的语义属性对群体的“兴趣点”进行建模,定义了基于WordNet的标签语义相似度,采用谱聚类算法对用户不同类别的“兴趣点”进行概念聚合;最后,将具有类别划分结构的标签组表示为兴趣点向量POIVector,作为社区群体的兴趣描述。实验结果表明,该算法能够在多用户存在的数据集中对标签进行语义聚类,采用表征用户群体兴趣达到了令人满意的效果。(3)传统个性化推荐方法通常只关注如何提高推荐的准确性,忽视了推荐结果多样性对用户体验的影响,针对该问题本文将社区用户关系挖掘应用到个性化推荐技术中,提出了一种基于用户关系挖掘的多策略推荐算法。首先,采用信任传播模型挖掘社区用户之间的信任关系,根据用户配置文件的余弦相似度计算社区用户之间的相似关系,将目标用户“信任好友”、“相似好友”的偏好项目作为候选推荐数据源;然后,给出了四种将用户信任度、相似度结合的策略,得到了用户之间的相关度指标,采用协同式的偏好预测机制对候选推荐项目的偏好得分进行计算;最后,依据偏好预测值生成降序的推荐列表,利用Top N选取原则将资源信息推荐给目标用户。实验结果表明,该算法不仅可以减少数据稀疏性的影响,而且能很好地兼顾推荐结果准确性与多样性指标,提高推荐算法的整体性能。