论文部分内容阅读
当代是信息大爆炸的时代,我们每天都在浏览着各色各样的新闻,很多时候,我们出现了“信息选择困难症”,这就是“信息过载”问题,因此,智能新闻推荐应运而生。通过为用户提供个性化的新闻列表,提高用户的阅读体验。目前网络新闻阅读已成为目前最热门的互联网的应用之一。冷启动问题是个性化推荐的一个一直存在且仍未被很好解决的问题,包括了用户冷启动和项目冷启动,而基于内容的推荐方法能解决项目的冷启动。本文首先对用户的冷启动问题进行研究,通过流行度推荐生成初始推荐候选集,再运用主题模型与基于内容的推荐,并与用户所处的情境信息相结合,同时充分利用基于负反馈的补足策略,经过循环迭代构建用户的兴模型。本文提出“适当停顿及感兴趣”的思路,构建多层次的循环迭代训练用户兴趣的新用户新闻推荐模型,为用户冷启动的问题提供好的解决方案。新闻推荐以用户识别和用户的个性化建模为核心,在网络上阅读新闻,很多新闻门户和新闻应用都并不要求用户注册登录,而用户为了方便,且更多的用户担心自己的信息被泄露出去也不愿意去注册登录后才浏览新闻,这就使得新闻推荐无法获取用户自己提供的个人资料以及一些显式的兴趣爱好,同时,用户在浏览新闻的过程中,也无意间留下了很多的“脚印”,比如IP所处的位置、进入系统的时间、浏览了哪些内容等隐式数据,本文正是在这样的一个前提下,进行新闻推荐的研究。本文为精准而且完整的刻画用户行为,将隐式获得的用户的新闻浏览日志分为长期、短期、近期、实时四个时间维度来构建用户的兴趣模型。由于新闻是动态的,且用户的兴趣也是动态的,用户兴趣会随着时间和情境的变化而变化,本文引入MAC地址、主题模型、情境信息,提出了基于主题的实时用户兴趣模型。该模型分为离线层、中间层、在线层三个层次,通过分层计算,该模型对实时处理表现出很好的效果。新闻属性作为每篇文章的固有属性,在很早以前的新闻推荐算法中就已经有研究者用来作为推荐的依据,且也取得了非常不错的效果,然而传统的基于新闻属性的推荐算法大多是假设这些属性是相互无关联互不影响的,而实际上,属性间或多或少的都存在影响,确实也有少数研究者考虑到了这种属性间的练联系,取得了不一般的效果,本文就是在前人研究是基础上,综合了主题模型的语义分析和对新闻属性的矩阵分解模型,在识别用户和用户兴趣模型的基础上,将一些可以获取的如用户主题和新闻主题以及新闻属性所具有的相关性都考虑到推荐算法中,提出了一种融合用户主题、新闻主题、用户行为属性、新闻属性以及情境信息的主题矩阵分解新闻推荐算法,已更加精准的方式向用户进行新闻推荐。实验结果表明,本文的所提出的新闻推荐算法在推荐的精准度上比传统的推荐算法有更好的效果,而且多样性指标表现优异。