主题模型与矩阵分解模型在信息流推荐中的应用

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:w18asp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网站的快速发展使得社交领域的推荐逐步成为推荐领域的重要研究方向之一,目前常见的社交领域的推荐有潜在好友推荐和信息流推荐。其中,信息流推荐的主体--信息流即为社交网络中信息流动的总线系统。将网站中的内容按照时间顺序呈现给用户一直是信息流的标准做法,且用户接受快。随着移动互联网和智能终端的广泛普及,使得创造内容的门槛空前降低,以至于时间顺序排列的信息流开始出现明显的信息过载,据Facebook数据显示,有80%的新鲜事不能被用户读到,Instagram也表示有70%的内容被用户错过。所以对各种信息流系统来说,最为重要的是要设法构建一个适用的推荐模型来发现用户感兴趣的信息、提高用户的使用黏性。本文首先介绍社交网络信息流推荐的研究背景和发展历史,然后介绍主题模型与矩阵分解模型的基础概念和基本方法,最终构建基于主题模型和矩阵分解算法的信息流推荐模型。所提模型的主要思想为:根据用户自身的历史微博内容应用LDA模型,提取用户主题维度的特征;然后以用户对词语的偏好替代用户的评分,利用得到的文档-主题分布和主题-词语分布构建用户和词语的隐因子向量,通过矩阵分解算法进行预测推荐,最终生成推荐列表给用户推荐满足其喜好的微博信息。最后,本文在实际的社交数据源上对文中的推荐模型进行了具体实验,并细致研究了实验的结果。首先论述了基于主题模型和矩阵分解算法的信息流推荐实验采用新浪微博的微博内容作为数据源的原因,并用描述性统计方法说明原始数据集的基本结构和内容;其次,本文依照实验流程处理、分割原始数据集作为模型的输入数据。然后通过推荐模型得到每位用户的推荐列表,并就模型结果分析了模型的评测指标。实验表明,在微博文本内容的基础上提取主题的方式可以使推荐模型有较好的推荐效果。
其他文献
未知多边形遍历问题不仅涉及算法设计与分析、计算几何、路径规划等基础理论问题,也是解决游戏产业、未知区域搜救等领域实际问题的基础。因此,本课题的研究,兼具理论意义和
缩短CPU的处理速度和存储器速度之间的差距一直是计算机体系结构中的一个关键挑战。传统硬盘的传输速度已经达到了瓶颈,因此基于闪存的固态硬盘的发展使这个瓶颈得到了一定的
本文研究的目标语法是连词If引导的英语虚拟条件句,因为由If引导的英语虚拟条件句在英语虚拟语气这一语法学习中最具有代表性,并且关于虚拟条件句教学的研究比较缺乏。另外,
随着我国综合国力的提高,研究生事业呈现蓬勃发展的态势。一方面源于经济和科技的高速发展,需要越来越多的拔尖人才参与到各行各业的建设中来;另一方面,越来越多的青年人希望
移动通信运营商为了确保所规划的网络能够很好地覆盖所有客户,通过覆盖预测来估计网络场强在各区域的分布,据此确定网络的问题点,进而改善规划方案或进行针对性的优化。本文
本文以2016年10月份首届亚太低碳技术峰会为背景,活动中笔者担任印度能源署官员哈里什·库玛·西克里先生的陪同翻译。主要活动任务包括负责西克里先生的日常出行、会议出席
3D技术可以提供场景的深度信息,从而使得观察者获得立体感知、体验更加生动真实的立体视觉,得到了国内外工业界和学术界的广泛关注。在3D技术领域中,立体图像深度调整具有重
不动产登记损害赔偿责任研究,极具现实意义,同时也是学界争议的焦点。关于不动产登记错误救济方式以及与之对应的不动产行为性质、不动产登记赔偿责任性质问题,学界争议由来
随着立体显示技术的不断发展,立体显示技术的产品成为信息技术的发展方向和趋势。但3D显示技术带给人们视觉冲击的同时,立体字幕显示质量和视觉舒适度一直不尽如人意。字幕作
随着计算机技术的飞速发展和电子数码产品广泛应用,我们能较容易的获取大量的多媒体图片或视频,处理这些大量的数据成为机器学习领域具有挑战性的研究问题,特别是在现实应用