论文部分内容阅读
随着互联网的普及和发展,人们获取信息的方式也在不断变化。不同的信息获取方式对于信息服务的技术也有不同的要求。一个总的趋势是逐渐由用户主动“拉取”信息转变成信息服务提供者主要向用户“推送”信息。面对海量的信息,用户希望得到个性化的服务。个性化推荐技术是个性化服务中最重要的技术,近年来在电子商务、电影和音乐等社区的推荐中起到越来越重要的作用。目前,个性化推荐算法主要集中在基于内容的推荐、基于协作过滤的推荐和基于规则的推荐三个方向。它们各有优劣,在不同的应用中发挥的效果也不同。订阅/推送系统也是个性化服务中的重要一环,主动推送服务在移动互联网中显得尤为重要。目前各大公司如Apple,Google等都建立有自己的推送服务。在互联网的环境下,信息数据源往往呈分布式的状态。在分布式环境下,实现个性化推荐的服务是一个新的尝试。对此,本文面向分布式异构数据源研究个性化的推荐和服务方式。本文首先针对本地的数据源,设计了个性化推荐的算法和基于主题的订阅系统,然后根据分布式的应用环境,设计了基于SOA的系统架构,实现各个数据源之间的信息共享。基于TF-IDF的向量模型设计了基于内容与基于规则相结合的推荐方式,并通过kd-tree,规则描述语言等手段优化推荐算法的效率。同时还引入反馈机制以学习用户的兴趣偏好。采用基于主题树的匹配算法实现了发布/订阅系统,同时实现了一个支持多种客户端的实时推送服务,保证了主动及时地向用户提供个性化信息。基于SOA的设计思想,通过将各个数据源的功能进行服务化的封装,实现了将各个数据源的信息的互通,提供了基于分布式异构数据源的个性化推荐服务。最后对整个系统的各项功能进行了测试。