论文部分内容阅读
近年来,在电子商务迅速发展的带动下,个性化推荐系统(PersonalizedRecommendation System)的研究工作获得了人们的极大关注,随着互联网应用范围的进一步扩大,推荐系统在其中发挥着越来越重要的作用。然而,传统的推荐算法大多是面向注册用户或者适用范围相对有限,而随着互联网用户数量的急剧增加和提供的服务日益多样化,客观上急需能够满足不同用户推荐需求的算法,此外,不同应用领域由于各自特点也需要有专门针对该领域的推荐系统,从这些实际应用需求出发,本文首先对面向未注册用户的推荐算法进行了研究。在传统推荐系统中,由于缺乏必要信息,未注册用户往往不能够享受到相应的推荐服务或推荐质量不高,为此本文提出了两种专门针对此类用户进行推荐的算法,它们分别是在传统的基于内容(Content-based)和基于空间关联规则(Association Rule-based)推荐的基础上扩展改进而来,这些算法利用众多未注册用户访问时留下的零散记录,从中提取出有用信息为推荐算法提供支持。实验结果表明,这些算法在一些特定条件下能够取得良好的推荐效果,但由于受到未注册用户可利用信息不足的限制,其应用范围相对有限。以电子商务推荐系统为代表的大多数推荐系统都是根据用户的当前浏览内容和历史访问记录来预测用户的个人偏好,然而在瞬息万变的信息时代,对于某些如新闻资讯、视频点播等具有时效性的应用领域,相比于个人历史偏好、PageRank等相对固定的因素而言,内容新鲜度、单位时间点击率以及其他用户的浏览效果或许更为重要,因为在这些领域,用户所感兴趣的内容是会随着社会事件的发展和时间的流逝而不断变化的,而传统的推荐系统由于对这些因素考虑不全而通常没能及时的反映这些变化。针对这一缺陷,本文创新性地提出有效性反馈思想,用户的每一次点击不仅会作为自己的历史访问记录,同时也会将对该内容的浏览效果实时的反馈至推荐系统;而对于待推荐对象来说,其获得的预测评分也不再是静态的,除了常规的查询相似度、内容长度、PageRank值、链入链出数量等,它还将受到内容新鲜度、访问量、浏览效果及全体用户评价等众多因素的影响。毫无疑问,这些因素的加入能够更加客观真实的反映出当前全体用户对于目标对象的综合评价,而这些评价又有助于对该用户的喜好做出预测。如何将反馈思想应用于各种具体的推荐模型是本文研究的另一项重要内容,排序学习(Learning to Rank)是解决这一问题的重要技术,本文详细讨论了如何结合排序学习技术将有效性反馈思想应用于各种传统的推荐算法,并通过实验分别检验了它的有效性和适应性。实验结果表明,相对于传统面向注册用户的推荐模型,反馈推荐模型能够在不显著降低系统性能的基础上有效提高项目评分的预测精度。