基于用户兴趣转移挖掘的流式推荐算法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:zl74531
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统是当下解决信息超载问题的有效方法,在经过学术界和工业界多年共同的研究和应用后,取得了卓越的研究成果。但是在移动互联网的时代中,数据量呈现几何式增长,传统推荐系统同时面临着可扩展性和数据稀疏性的双重考验。同时,随着时间的迁移,用户的兴趣偏好也在不断发生变化,一个成功的推荐系统应能捕捉并适应这些变化。为了应对上述挑战,本文提出了一种基于用户兴趣转移挖掘的流式推荐算法,主要从矩阵预填充、流式推荐模型的构建和遗忘机制三个方面展开研究并对其缺点进行针对性的改进。(1)带有流行度惩罚项的矩阵预填充方法。传统的协同过滤算法无法适应过于稀疏的数据,而矩阵预填充方法可以基于先验知识对缺失评分进行估计和填充,能够在一定程度上缓解数据的稀疏性问题。在对Enhanced SVD(ESVD)预填充方法的评分误差进行分析后,本文提出预填充评分的误差与用户活跃度及资源流行度之间具有正相关性的假设,并基于ESVD方法设计了一种带有流行度惩罚项的矩阵预填充方法ESVD-P,提高了预填充评分的精度,改善了模型后续的训练质量。(2)基于种类信息构建的改进流式推荐算法。为了能够及时应对外界的变化,流式推荐算法大多采用了增量更新的在线学习方式,根据流数据对模型参数进行实时更新。本文指出在面向特征向量的增量更新策略中,模型的整体拟合残差会不断扩大,为了避免这种现象,本文提出了一种基于资源种类信息的流式推荐模型streamGBMF,该模型利用资源的种类信息来构建资源特征矩阵,于在线学习的过程中,模型采取只对用户特征向量进行实时更新的增量更新策略,从而避免了模型整体拟合残差不断扩大的问题。(3)改进的遗忘机制。由于用户的兴趣偏好会随着时间的迁移而不断发生变化,用户的部分历史数据已经无法正确反映出用户当下的兴趣偏好,为了去除这部分“过时”数据的影响,推荐模型需要引入“遗忘”机制,然而现有的遗忘机制无法从历史数据中有效地区分用户的临时偏好和长期偏好,因此会丢失历史数据中的宝贵信息。基于以上考虑,本文结合streamGBMF模型的特点,提出了两种新型的“遗忘”机制:奇异点移除法和时间衰减置信度法,能够有效的保留用户的长期偏好信息。在基于公开数据集MovieLens 1M模拟的流数据环境下,通过对比实验的结果表明,本文提出的streamGBMF模型在整体的推荐质量上有显著提升。结合不同条件下的对比实验分别验证了模型中提出的矩阵预填充方法、改进流模型和遗忘机制的有效性,证明了本文算法在流数据的环境下,能够更准确地捕捉用户当下的兴趣偏好,并提供高质量的推荐结果。
其他文献
目前,5G时代近在咫尺,“连接”成为了最为重要和基础的特征。在此背景下,“大连接”将成为中国移动持续创新的发展趋势,这对移动技术的创新与科技管理提出了更新更高要求,而创新的活力最终取决于公司竞争性科技型人才队伍水平。因此,移动公司亟需进行人力资源管理创新型发展以适应移动新型信息化竞争。作为永州规模最大的通信运营商,中国移动永州分公司目前面临着日益严峻的科技人才竞争形势。一方面,由于公司在科技人才的
近年来,财务舞弊案层出不穷,引起了资本市场的混乱,挫败了投资者的信心。为了规范我国资本市场的秩序,提高财务信息的质量,我国制定了一系列的规定。2010年,我国政府发布了《企业内部控制配套指引》,其涵盖了18条具体指引。其中,《企业内部控制审计指引》规定,2012年,内部控制审计应该首先在我国主板上市的公司中实行。并提出,两种审计业务既有区别又有联系。该指引中还指出:财务报表审计和内部控制审计既可以
纯铁材料因其优异的塑性、耐冲击韧性、电磁性能,广泛应用于航空航天、能源动力、国防军工等领域。但纯铁属于典型的难加工材料,切削纯铁过程中切削变形大、加工硬化严重、刀
对于具有大量资源的出版行业来说,个性化推荐是解决信息超载的一个有效方法。在推荐算法中,矩阵分解算法取得了很好的推荐效果,但是也存在一些问题。本文以矩阵分解算法为基
随着社会和经济的发展,社会人口压力增大,人口老龄越趋严重。老年人的心理健康问题引起社会的关注,社会工作事务所和社工承担了政府购买老年人心理健康和精神陪伴项目实施工作。本研究通过项目中社区情绪舒缓活动在改善老年人状态是否有作用进行行动研究和问卷调查。通过对194名老人针对项目和群体需求,依据理论和社会工作经验设计并开展社区活动,活动后进行活动满意程度调查发现:总体来看80%以上的老人对此次活动是满意
而今社会随着信息科学技术的不断加快发展,我们对信息的需求量也越来越大。但是现在以硅为基础的电子器件已不能满足我们的生活需求,新兴学科-分子电子学就应运而生。研究者
神经进化对于神经网络的进一步发展起着决定性的作用。传统的浅层神经进化方法多以改变网络初始权值为主,不能最大化提高神经网络的精度;深层神经进化方法的出现为自动设计神经网络结构的研究开辟了一条新的途径,但在如何定义网络结构的搜索空间,以及如何设计有效的搜索策略上仍有较大的改进空间。针对上述问题,提出了基于仿生优化算法的神经进化方法体系,该方法体系从优化理论的角度对神经网络的权值空间和结构空间进行了定义
关于预期后悔的研究,大多集中于预期后悔对决策的影响。近些年来出现了一些关于预期后悔的影响因素的研究,并发现了规范理论和决策判断理论。但关于个体人格特质对预期后悔的影响的研究仍较少。已有研究发现自尊水平能够影响个体的后悔倾向,但未产生系统的关于自尊水平对预期后悔的影响研究。本研究探讨了中年人的自尊水平对预期后悔的影响,并引入规范理论和决策判断理论两种理论框架,综合探讨了自尊水平、决策常规性和谨慎程度
软件安全问题无论对于个人还是企业都至关重要,在Windows操作系统下的软件安全问题尤为严重。传统的基于静态检测与动态检测的恶意软件检测方法难以适应不断变种的恶意软件,
近年来,随着边缘计算技术以及云计算技术的迅猛发展,越来越多的学者和研究人员致力于将边缘计算平台和云计算平台进行整合,实现“边云一体化”。因此,如何在边云一体化环境下