基于主题矩阵分解模型的新闻推荐算法研究

来源 :广西师范学院 | 被引量 : 0次 | 上传用户:luckyxiaoxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当代是信息大爆炸的时代,我们每天都在浏览着各色各样的新闻,很多时候,我们出现了“信息选择困难症”,这就是“信息过载”问题,因此,智能新闻推荐应运而生。通过为用户提供个性化的新闻列表,提高用户的阅读体验。目前网络新闻阅读已成为目前最热门的互联网的应用之一。冷启动问题是个性化推荐的一个一直存在且仍未被很好解决的问题,包括了用户冷启动和项目冷启动,而基于内容的推荐方法能解决项目的冷启动。本文首先对用户的冷启动问题进行研究,通过流行度推荐生成初始推荐候选集,再运用主题模型与基于内容的推荐,并与用户所处的情境信息相结合,同时充分利用基于负反馈的补足策略,经过循环迭代构建用户的兴模型。本文提出“适当停顿及感兴趣”的思路,构建多层次的循环迭代训练用户兴趣的新用户新闻推荐模型,为用户冷启动的问题提供好的解决方案。新闻推荐以用户识别和用户的个性化建模为核心,在网络上阅读新闻,很多新闻门户和新闻应用都并不要求用户注册登录,而用户为了方便,且更多的用户担心自己的信息被泄露出去也不愿意去注册登录后才浏览新闻,这就使得新闻推荐无法获取用户自己提供的个人资料以及一些显式的兴趣爱好,同时,用户在浏览新闻的过程中,也无意间留下了很多的“脚印”,比如IP所处的位置、进入系统的时间、浏览了哪些内容等隐式数据,本文正是在这样的一个前提下,进行新闻推荐的研究。本文为精准而且完整的刻画用户行为,将隐式获得的用户的新闻浏览日志分为长期、短期、近期、实时四个时间维度来构建用户的兴趣模型。由于新闻是动态的,且用户的兴趣也是动态的,用户兴趣会随着时间和情境的变化而变化,本文引入MAC地址、主题模型、情境信息,提出了基于主题的实时用户兴趣模型。该模型分为离线层、中间层、在线层三个层次,通过分层计算,该模型对实时处理表现出很好的效果。新闻属性作为每篇文章的固有属性,在很早以前的新闻推荐算法中就已经有研究者用来作为推荐的依据,且也取得了非常不错的效果,然而传统的基于新闻属性的推荐算法大多是假设这些属性是相互无关联互不影响的,而实际上,属性间或多或少的都存在影响,确实也有少数研究者考虑到了这种属性间的练联系,取得了不一般的效果,本文就是在前人研究是基础上,综合了主题模型的语义分析和对新闻属性的矩阵分解模型,在识别用户和用户兴趣模型的基础上,将一些可以获取的如用户主题和新闻主题以及新闻属性所具有的相关性都考虑到推荐算法中,提出了一种融合用户主题、新闻主题、用户行为属性、新闻属性以及情境信息的主题矩阵分解新闻推荐算法,已更加精准的方式向用户进行新闻推荐。实验结果表明,本文的所提出的新闻推荐算法在推荐的精准度上比传统的推荐算法有更好的效果,而且多样性指标表现优异。
其他文献
无线传感器网络是21世纪备受关注的研究热点之一,已广泛应用于军事国防、医疗护理、城市管理、地震监测、设备监测、建筑物结构监测等明显带有实时性需求的领域。本课题来源
随着我国经济、工业的不断发展,资源的利用也在逐步增加,随之而来的就是资源污染、短缺的问题,其中最为显著的就是水资源。我国人口众多,在水资源占有方面远低于其他国家,人
随着计算机信息处理技术和通信技术的快速发展,每天都会产生大量的数据,对于一些资源有限的设备,如何在处理这些大量信息的同时保障其安全性是一个至关重要的问题。一种可行
针对当前词语相似度计算方法存在的局限性:基于语义词典的词语相似度计算方法依赖字典进行相似度计算,因此无法对字典未登录词语进行计算;基于语料库的词语相似度计算方法在计算
RFID系统有许多种类的安全与隐私保护方式,其中采用安全认证协议是性价比最优的,所以运用最广。这些安全认证协议大多是突出了两个主要途径:一种是哈希锁方案,需要随机数发生
随着互联网技术的快速发展,搜索引擎已成为许多人生活和工作中的重要工具。但是,由于网络信息的快速增长和用户搜索要求的不断提高,通用搜索引擎已经不能满足用户对于信息检
关联规则作为数据挖掘的一个热点方向,已经引起很多学者的广泛关注。本文在介绍权值和负关联规则的基础上,重点讨论了加权负关联规则的增量更新和剪枝算法。加权负关联规则的
当前网络环境下,计算机病毒的迅速演化导致了反病毒技术的不断发展,反病毒史上病毒查杀技术层出不穷,其中传统的特征码技术是最基础的技术。特征码技术主要是将被测程序具有
人睑识别是通过计算机提取脸部特征,并利用这些特征与人脸库中已有的人脸进行比较,从而完成身份验证的一种技术。近年来,随着计算机技术的发展,它作为一个重要的研究方向已经
本文开发的一种基于Web的路产影像管理系统实现了B/S模式下道路综合信息的网络化管理,这些信息包括道路影像资料、沿线道路设施及GPS信息等数据。如何将这些纷繁芜杂的数据准