论文部分内容阅读
随着普通用户参与到互联网信息的架构和创建当中,互联网信息出现了严重的过载。如何帮助用户组织、管理和检索信息,成为一个巨大的挑战。传统的信息搜索和信息过滤技术具有一定的缺陷,比如不具有智能,对用户的区分度不高。推荐系统通过生成、调整用户的特征模型,利用不同的推荐算法为用户主动做出信息资源的推荐服务,被认为是解决信息过载的有效方法。随着广大用户的参与,互联网呈现了社会化的发展趋势,其一个典型代表:社会化标签,从用户的角度对资源添加标注,反映了用户的兴趣、偏好和概念空间等其他方法难以获取的用户信息,被认为是一种高效的信息组织方式。基于标签的推荐服务框架利用标签数据中的用户、资源和标签之间的关联信息,为用户提供个性化的推荐服务。基于标签的推荐系统主要有三种方法:一是基于网络的方法;二是基于张量的方法;三是基于主题的方法。各种方法能够一定程度上解决推荐系统的一些问题,比如网络方法能解决数据的稀疏性问题,张量方法能解决多维数据的降维问题,主题的方法有合理的模型解释。本文分别从网络结构、张量模型和潜在语义三个角度分析基于标签的个性化推荐系统,提出一种混合的推荐服务框架,能够有效地将基于网络、张量和主题的方法结合到一起,具有很好的灵活性和扩展性。本文所研究的主要内容如下:首先研究了一种基于标签的混合的个性化推荐服务框架,将不同类型算法的输出转化为一种能够表明用户、资源和标签标注可能性的四元组形式,并最终以评分立方的形式进行组织和存储。然后,通过一个统一的框架,基于标签的混合的个性化推荐方法能够同时提供三种不同的推荐服务:推荐资源、推荐标签和用户推荐,不再需要为满足不同的推荐需求而重新设计和实现新的推荐系统。最后,利用Hadoop框架分别实现了HOSVD、LDA和FolkRank三类不同类型的算法。