论文部分内容阅读
这是一个信息急剧膨胀的世界!传统的用于解决信息过载的信息检索和分类目录已经远远不能满足人们每天所面临的信息选择,个性化推荐作为一种泛信息检索,可以从用户积累的历史数据中挖掘出一定规律,为用户自动过滤掉一些不必要的信息,并根据用户的偏好来主动推送最为合适的信息,大大提高用户的选择效率。近十几年,随着大数据时代的到来,以及对推荐系统的深入研究,人们迫切地需要能更加理解语义信息的智能化推荐模型;而另一方面,随着线下服务业与线上互联网的结合,地理环境中的空间要素也逐渐成为推荐系统中不可忽略的重要信息之一。 为此,本文基于韩家炜等提出的“异构网络中基于元路径相似性的个性化推荐模型”,从数据模型和推荐模型两个角度,针对传统推荐模型在语义信息和空间特性两方面处理的不足之处,提出了空间异构信息网和语义路径相似性,并结合空间分析,得到一种考虑语境和空间的个性化推荐算法。论文主要成果如下: (1)由二部图引入异构信息网,结合本体和空间特性,提出了空间异构信息网这一新型数据组织模型。该空间异构信息网由知识层、实例层和地理层三部分组成,相比异构信息网新增了地理层,同时用本体完善了知识层节点属性的语义信息,能更加全面地表达信息在时间、空间和属性三方面特性。 (2)利用空间异构信息网中的本体信息,改进了传统的元路径相似性,提出了语义路径相似性。该语义路径相似性进一步考虑了知识层节点属性之间的父子和兄弟关系等概念层次的语义信息,使得节点的相似性计算结果更加准确和精细化。 (3)采用空间分析和用户历史记录,改进了传统推荐模型中简单地将空间特性作为一种属性来参与相似性计算的不足,提出了一种基于用户空间活跃度来预测被推荐项目(以下简称项目)的空间权重的计算方法,将空间特性从属性域转移到了空间域来计算,使得空间信息得到了更加充分的利用。 (4)最后本文以空间异构信息网为数据组织基础,采用语义路径计算项目的相似性,利用空间活跃度预测项目的空间权重,对相似性加以校正,提出了空间异构信息网中基于语义路径的个性化推荐模型。同时,本文还收集了上海市大众点评网的餐厅POI数据,设置了四组对照实验,对模型进行了验证,实验结果表明,从整体来看,考虑了语义和空间活跃度的算法都能在一定程度上提高推荐的准确度,而且空间活跃度对推荐效果的提高比语义更明显,同时随着数据量的增加,语义信息和空间活跃度对推荐结果的提高效果越好。