基于贝叶斯局部概率矩阵分解推荐方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:abcttf2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统已经在多个不同领域中广泛应用,是一种智能高效的信息过滤平台,根据用户历史行为或者提供的需求中表现出的喜好、兴趣,为用户进行推荐可能感兴趣的项目。在推荐系统中,应用最成功、最广泛的推荐技术之一是协同过滤技术,而协同过滤的一个强大分支是概率矩阵分解推荐算法,在面对大规模数据、数据稀疏性问题时表现亮眼。本文总结了当前常用推荐算法的相关知识及基本内容,以概率矩阵分解算法(Probabilistic Matrix Factorization,简称PMF)的为基础,引入了谱聚类方法,从而挖掘用户社交信息。与此同时,本文使用贝叶斯的方法来改进概率矩阵分解模型,使得模型不再需要人工手动调参。还有另一个亮点就是本文使用吉布斯采样算法对模型进行采样训练,进一步提升模型精度。本文的主要工作和亮点包括以下几个方面:(1)对概率矩阵分解模型展开了较为深入的研究,详细地介绍了该算法的原理,包括矩阵分解和引入概率分布求解等相关知识并且将之应用到真实数据集中,验证了PMF对于解决数据稀疏性问题的优越性。(2)引入谱聚类算法,在进行矩阵分解之前先通过计算用户相似度,用聚类的方法把原始评分矩阵分割成数个子矩阵,本文提出的贝叶斯局部概率矩阵分解推荐算法(Bayesian Local Probabilistic Matrix Factorization,简称BLPMF)模型之所以能有效减轻“冷启动”问题影响,引入谱聚类算法是主要原因。(3)采用贝叶斯的方法优化传统概率矩阵分解算法。把系统参数作为服从高斯-威沙特(Gaussian-Wishart)分布的随机变量,转而估计该分布的参数(超参数)而不是像PMF算法一样,把系统参数当作一个固定值估计,需要人工仔细地调整参数,否则容易出现过拟合现象。(4)使用马尔科夫链蒙特卡洛(Markov Chain Monte Carlo,简称MCMC)方法中的吉布斯采样算法对超参数,特征向量(如用户和项目)采样,自动选出最优超参数。(5)通过贝叶斯局部概率矩阵分解推荐实例研究,在一个由kaggle赞助商提供的脱敏处理过的APP活动数据集上进行应用实例研究,并对可能给算法效果带来影响的相关因素进行分析,验证了本文BLPMF算法的实用性和有效性。
其他文献
目的观察糖平煎对2型糖尿病(T2DM)大鼠糖脂毒性和胰岛素抵抗(IR)的影响。方法采取高热量饲料喂养结合小剂量链脲佐菌素(STZ)腹腔注射的方法复制T2DM大鼠模型,分为正常对照组
随着生活水平的提高,人们对海参等海珍品的需求量越来越大。海参的养殖水深一般是10~40m,主要以人工下潜捕捞的方式进行成品捕捞。潜水式采捕不但产量低,成本高,而且会严重损
牛乳是一种大众化食品饮料,掺假的现象时有发生。有些掺假通过感官检查就可以判断出来,但不少的掺假则应通过物理的和化学的方法才能做出判断。主针对鲜牛乳的主营养成分以及正
为了解决公路行车人在符合技术状况指标要求的高速公路行车仍有振动引起的不适体验问题,本文开拓性地将路面养护和汽车振动舒适性设计标准联系起来,对两者分别作了详细介绍,
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种主动式的对地观测系统,具备全天候、全天时、高分辨率、多波段、多极化、可变侧视角等特性,被大量应用于农业生产、军事侦
目的:对hsa-miR-105进行靶基因、功能富集分析(GO分析)、信号通路富集分析、靶基因编码蛋白相互作用分析及与LncRNAs之间联系枢纽等生物信息学分析,为后续研究其功能提供线索
<正>今天很多企业都在讨论数字化转型,的确,我们身处在一个信息化的时代,没有一家企业能置身事外。我认为数字化是一种工具,不是目的。数字化能够提供全新的解决方案,为企业
这里所要讨论的“包干制”,按照《物业服务收费管理办法》的解释,指的是.由业主向物业管理企业支付固定物业服务费用,盈余或者亏损均由物业管理企业享有或者承担的物业服务计费方
SAGD超稠油采出污水悬浮物含量较高,其本身具有很多杂质,成分复杂,乳化严重,十分难以处理。超稠油采出污水中悬浮物大部分为有机成分,并非真实的机械杂质颗粒,很难脱稳汇集。
船舶优先权是海商法规定下保障船员基本工资福利的特定权利。明确船员外延是准确适用船员工资福利优先权的前提。基于船员资质区分不同法律关系下船员工资福利优先权的主体范