增量矩阵分解中线性特征变换的研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:stefanie456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矩阵分解是推荐系统中应用最为广泛的技术之一,由于其高精度、高效率、易实现、易拓展而为人们所知。现如今,大部分的矩阵分解都是批处理式模型。此类模型一般要求训练阶段与测试阶段明确分离,利用数据完成相关模型的训练之后不再对模型进行更新及修改。然而在现实世界的在线场景中,新数据的到来,往往意味着特征的改变。因此增量地对矩阵分解模型进行更新完善是一类非常重要的需求。虽然目前对于增量式矩阵分解问题,已经有相当一部分研究工作用于改善其分解效果,但除了精度的提升之外还有许多亟待解决的问题。例如,更新效率如何改善,超参数是否能够重用,模型的一般性如何保证以及是否能够对增量过程的误差界进行分析。为了解决上述问题,由向量自回归模型的启发,本文对增量矩阵分解模型提出了一种具有一般性的框架。当一批增量数据到来时,该框架能够高效地对用户及项目的潜在特征向量进行更新。而所提出框架的关键技术在于:通过训练用户和项目特征随时间进行的线性变换取代传统方法中直接对原问题所有参数进行的重训练。此外对于所提出框架,通过利用与规模无关参数的批量式矩阵分解模型,使模型规模增大时的调参代价大幅减少。不仅如此,本文还通过形式化定义对所提出框架的一般性进行说明,即大部分具有显式目标函数的批量式矩阵分解模型可以通过该框架拓展为增量式矩阵分解模型。与此同时,本文还从低秩近似角度对该框架进行了合理性的解释,并给出在某些特殊情况下使用该框架进行增量学习时所能达到的训练误差上界。最后,通过对所提出框架在两个真实世界数据集上进行大量实验,说明其在精度,效率,存储开销以及样本使用率方面的优越性。
其他文献
2004年,仿乎在一夜之间,刚满"周岁"生日的三水宝力高无机材料有限公司在佛山陶瓷行业里面家喻户晓,生产订单似漫天飞舞的雪花一齐涌向这个年轻却充满朝气和希望的公司.行业权
想想看,在日常生活中,你是不是常常将这些话挂在嘴上,“我还没办法赶完,再给我一些时间,好不好?”“我知道时间快到了,可是我真的
由中唐至宋,是江西茶业经济发展与定型的关键时期,与中国古代经济重心南移具有一定的同步性。茶业的发展有助于提高江西经济开发程度、推动经济重心南移的进行,当然也是经济重心南移这一现象的重要表现之一。江西在唐代已是著名的茶产区,境内八州中就有七州产出茶叶,茶叶产地分布较广,名茶如洪州西山白露、袁州界桥、浮梁茶等等已闻名当世,茶业经济逐渐成为本区经济的一个内容。到了宋代,茶叶专业化生产程度更高,茶叶产地更
随着中国经济的快速发展,品牌鸡蛋从无到有,由弱渐强,直到现在线上线下零售渠道遍布。在快速发展的同时,关于品牌鸡蛋营销的应用研究却没有同步发展,尤其是可以应用于具体企业的营销策略研究。本文在国内消费结构升级,品牌鸡蛋在京津冀市场已经成为日常消费品的大背景下,将GY公司作为研究对象,运用PEST分析、行业竞争环境分析和SWOT分析等工具,对GY公司品牌鸡蛋的宏观、微观营销环境进行了系统性的分析。得出了
国内外很多学者用自蔓延高温合成法、自蔓延高温合成同电弧熔炼铸造技术相结合法、放电等离子烧结等方法合成了TiAl/Ti2AlC复合材料.最近,作者以Ti、Al、TiC粉为原料,用原位
产业集群的转型升级与区域创新型网络的可持续发展密切相关。创新型产业集群的发展一直是创新型网络理论与实践的研究热点。本文通过使用集群创新型网络的利益关系、动力机制
目的:随着技术手段的进步和患者需求的逐步提高,近年来,即刻种植逐渐开始应用于磨牙区。本文将通过对磨牙区即刻种植和延期种植病例的观察研究,分析磨牙区即刻种植与延期种植
你熟悉什么就做什么生意你熟悉什么就做什么的生意,这句话是说:做内行生意。前面提到一个司机,开车开了十几年,平时就爱钻研,结果发明了轿车用多用豪华防火枪、尾气罩、轿车
在当今社会各种文艺团体中,民族歌舞团是最具代表性,传承性,最具特色的文艺团体。凉山彝族自治州歌舞团作为凉山州民族文化保护和传承的载体,从建团到现今已有63年的历史,是