论文部分内容阅读
Web社区作为社会化网络(Social Web)的重要组成部分,已经在全球范围获得了巨大成功,并保持高速增长。Web社区由一群追求相同兴趣或目标的人组成,社区成员通过互联网进行交流、沟通与协作。Web社区已经深入到人们日常生活的方方面面,使得人们获取信息更为迅速、交流沟通更为快捷,为民众带来更公平的话语权,为企业创造更公平的竞争环境。互联网上的社区数以亿计,例如Facebook就拥有超过6亿个社区,Web社区巨大的数量和持续的增长趋势,意味着用户在选择社区时面临着严重的信息过载问题。社区推荐是解决该问题最有效的工具。对一般用户而言,Web社区推荐可以帮助用户在海量社区中选择有价值的社区加入,以更好地与其他用户交流、共同学习和工作;对社区提供商而言,Web社区推荐可以吸引用户加入更多社区,促进社区的发展以创造更大的经济价值。因此开展Web社区推荐方法与系统的研究具有重要的社会和经济意义。Web社区拥有鲜明的主题,社区主题是用户聚集的原因;Web社区作为被推荐给用户的项,同时由用户组成,并且用户之间存在社会关系。针对上述Web社区的特性,本文研究内容主要包含以下四个部分。(1)基于潜在主题的准确性Web社区协同推荐方法传统的基于显式主题关联的推荐方法难以应对数据稀疏问题;基于隐式主题关联的推荐方法可以更好地应对数据稀疏问题,但容易产生不准确的推荐结果。针对上述问题,本文提出一种基于潜在主题的准确性Web社区协同推荐方法。该方法首先利用隐式主题关联,得到用户与社区在潜在(隐式)主题上的关联度,将在潜在主题上关联度高的社区推荐给目标用户。然后利用协同过滤思想,提高目标用户的相似用户所加入社区的排名,尽可能去除隐式主题关联可能导致的不准确结果,以提高推荐的准确性。(2)基于用户-社区全域关系的新颖性Web社区推荐方法现有大多数推荐方法属于准确性推荐,该类方法单纯追求推荐的准确性而忽视新颖性。然而一味强调准确性可能会降低推荐系统的质量。本文提出一种基于用户-社区全域关系的新颖性Web社区推荐方法,用户-社区全域关系指Web社区中客观存在的三种交互,即用户-用户、社区-社区以及用户-社区交互。该方法向用户推荐新颖性社区,即用户不知道但有潜在兴趣的社区,旨在扩展用户视野和推动社区本身的发展。该方法首先提出WLDA(Weighted Latent Dirichlet Allocation)算法计算社区对用户的推荐准确度,WLDA利用用户-社区交互的强度提高推荐的准确性。接下来利用用户-社区全域关系定义社区对用户的新颖度,并提出了社区新颖度计算方法。最后为了提高整体推荐质量,利用多目标优化策略融合社区的推荐准确度和新颖度。(3)基于用户-社区全域关系闭包的高效均衡性Web社区推荐方法本文提出基于用户-社区全域关系的传递闭包融合推荐的准确性和新颖性,旨在进行高质量的均衡性Web社区推荐,该传递闭包指Web社区蕴含的用户-用户、用户-社区和社区-社区多阶交互;同时提出包含离线建模和在线推荐的方法框架,旨在提高推荐效率。基于前述传递闭包,NovelRec离线建模用户邻域、邻域用户主题相似度和社区主题距离。该方法利用用户-用户和用户-社区多阶交互,将目标用户的邻域用户加入的社区作为其候选社区,根据邻域用户与候选社区的交互,计算候选社区对目标用户的准确度。该方法利用前述三种多阶交互,提出一种用户-社区距离度量方式,结合该距离、邻域用户在候选社区中的参与度以及社区属性,计算候选社区的新颖度。在此基础上,NovelRec最终进行均衡性社区推荐,兼顾推荐结果的准确性和新颖性。(4)构建Web社区推荐原型系统针对Web社区特性,分别从推荐准确性和新颖性出发,本文提出了三种社区推荐方法。本文在Web社区管理原型系统基础上,加入社区推荐原型系统作为高级应用功能,根据用户在社区中的多种行为、以及社区自身的属性信息,对用户进行准确性、新颖性和均衡性社区推荐。