论文部分内容阅读
随着互联网和信息技术的不断发展,特别是近年来各种社交媒体的涌现,人们可以更加方便地通过多种社交媒体来获取好友及其他人发布的各种信息。这些技术基本满足了用户对各种信息的实时获取需求,但同时也带来了令人困扰的信息过载问题。因而,作为该问题的最有效解决方案—推荐系统近年来受到越来越多的研究者和工程师的关注。目前,研究者提出了多种推荐方法来解决商品、图书等领域的推荐问题并取得很好的成果。但是,不同于这些领域的推荐问题,由于信息推荐缺少显式的用户反馈信息,因而我们无法直接利用那些传统的推荐方法来解决该问题。为了在缺乏显式反馈信息的情况下解决用户所面临的信息过载问题,本文尝试利用微博用户及其关注好友的历史数据来获取用户的兴趣相关信息,然后分别通过个性化新闻推荐和信息流排序的方式来解决信息过载问题。本文研究工作主要包含以下几个方面:首先构建微博爬虫来获取本文的实验数据,然后针对推荐领域面临的数据稀疏问题,结合微博用户的特点设计了两种数据扩展方法来扩展用户的数据,并且通过实验的方式证明了这两种方法能够有效缓解数据稀疏问题。针对新闻推荐问题,首先使用传统的基于内容的推荐方法来进行尝试,为了解决该方法推荐结果不理想的问题,本文分别基于逻辑回归和支持向量机模型设计了两种新闻推荐方法,并对其中存在的问题进行了分析。在分析了逻辑回归和支持向量机的局限性后,选择采用排序学习的方法对新闻进行推荐,分别提出了基于贝叶斯优化准则的推荐方法和基于Rank SVM的推荐方法。另外,对于用户兴趣的动态性变化问题和推荐的新颖性和多样性的需求,文中分别提出了对应的解决方案。对于用户面临的信息流过载问题,文中分析了用户使用微博的多重目的以及微博平台所具有的不同属性,提出融合多个特征的信息流排序方法,利用该方法来对用户的好友信息进行个性化排序,以此来达到帮助用户有效获取信息的目的。