论文部分内容阅读
随着互联网的普及与Web2.0技术的日益成熟,网络数据爆炸式增长,人们被淹没在浩如烟海的数据汪洋中而难以获取有用价值的信息。个性化推荐系统作为帮助人们获取有用信息、有效解决信息过载问题的工具,受到业界广泛关注。与此同时,随着社交网络的迅速发展与普及,基于社交网络的推荐算法成为推荐系统中一个新的研究热点。传统个性化推荐系统大多关注于只含单一物品类型、单一用户-物品关系的应用,无法适用于社交网络这一具有多种物品类型以及多种用户行为关系的复杂异构信息网络。因此,如何有效利用社交网络的异构性信息成为推荐系统领域的研究热点。与此同时,传统推荐系统大多致力于改进基于评分预测的推荐算法性能,然而推荐系统的真实目的是找到用户最有可能感兴趣的Top-N个推荐对象,而不是预测用户对推荐对象打多少分,因而基于评分预测的推荐内容不具有排序性。因此,面向排序的Top-N的推荐算法正受到越来越多的研究者们的关注。此外,由于基于评分预测的推荐算法采用的是显式用户反馈的数据,而显式用户反馈在实际生活中要比诸如用户历史购买、浏览记录等的隐式反馈少的多,因而基于评分预测的推荐算法常常存在数据稀疏、冷启动等问题,如何利用隐式用户反馈来改善、避免由数据稀疏、冷启动引起的问题也是推荐系统领域重要的研究方向。论文在分析和总结现有个性化推荐技术的基础上,对隐式用户反馈下的异构社交网络的Top-N推荐问题进行了研究。针对异构社交网络,论文在分析主流的基于路径间语义的相似度测量算法以及这些方法优缺点的基础上,对不同类型对象之间的相似度测量进行了研究,提出了以量化、集成同一路径不同位置的相似度为途径,利用路径间(inter-path)和路径内(intra-path)的相似度语义信息的相似度测量算法HybSim。进一步的,论文以HybSim为相似度测量算法,以贝叶斯排序优化为学习方法,在隐式用户反馈下的异构社交网络中,量化、集成多条元路径的相似度语义,进而建立了基于贝叶斯排序优化的Top-N推荐算法HybRec。该推荐算法通过利用社交网络中的异构性信息以及隐式用户反馈,能有效解决数据稀疏、冷启动等问题,进而提升推荐系统的性能。论文工作的主要创新性成果如下:1.针对现有异构社交网络的相似度测量算法的不足,论文对异构社交网络中不同类型对象之间的相似度语义进行了研究,提出了基于异步双向随机游走的相似度测量算法HybSimo该算法能够充分挖掘异构社交网络中的路径间(inter-path)和路径内(intra-path)的相似度语义信息,有效提高相似度测量的准确性。2.针对传统推荐系统无法利用社交网络的异构性以及隐式用户反馈数据而导致的数据稀疏、冷启动等问题以及进而造成推荐性能下降的问题,论文对隐式用户反馈下的Top-N推荐问题进行了研究。论文首先将隐式用户反馈以及社交网络组织成一个异构社交网络,然后通过HybSim相似度测量算法量化元路径的相似度语义。在此基础上,利用面向排序的贝叶斯排序优化(Bayesian Personalized Ranking)[44]方法集成不同元路径的相似度,提出了一个基于异构社交网络中多种混合信息的Top-N推荐算法HybRec,有效解决了数据稀疏等问题,进而提升了推荐系统的性能。3.论文利用DouBan和RT-IMDb两个真实数据集,对相似度算法HybSim和推荐算法HybRec进行实验评估。实验分别从相似度测量准确度和推荐算法分类准确度验证了算法的有效性,证实了通过综合路径间与路径内的相似度语义能够提升推荐系统的质量。