推荐系统的协同过滤、矩阵分解和k近邻方法及其优化

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lxz119110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的兴起,信息过载越来越困绕着人们,如何从大量的信息中寻找到自己需要的内容成为了大家关注的焦点,在此情况之下,推荐系统应运而生。  本文主要介绍了目前最为流行的集中推荐系统算法。包括协同过滤算法,奇异值分解算法和kNN算法,并对它们进行了相应的改进和提高。  对于协同过滤算法,我们更新了传统的相似度度量,提出了一种混合的相似度度量,从而改进了原始算法中的单一度量;进一步地,我们还提出了使用K--means对用户进行聚类的协同过滤算法,降低了算法的复杂度。针对奇异值分解算法,我们提出了结合人口统计学信息的特征值分解算法;此外我们还引入了局部结构化的奇异值分解方法,对原有的模型进行了进一步的优化;同时,我们在奇异值分解中也介绍了一种虽然效果较差但是算法复杂度更低、实现速度更快的算法—分块的SVD方法。针对kNN算法,我们进一步更新了行相似度的算法,除了协同过滤算法中能考虑的内容,我们增加了用户的人口统计学信息,通过用户群体之间的差别和用户个体之间的差别综合地描述用户相似度;进一步地,我们提出了结合用户和商品偏移的kNN算法,在描述近邻的评分时考虑不同用户和商品之间本身可能存在的评分偏差对算法进行修正,使得算法结果有了很大的提升。
其他文献
为了研究复垦类型对重金属有效态含量的影响,以复垦8年的山西省霍州市曹村煤矿煤矸山复垦农田、果园和退化荒地为研究对象,分析了3种复垦样地中土壤理化性质、重金属有效态含
本文通过研究产出缺口与通货膨胀关系,揭示通货膨胀所反应的经济运行深层次矛盾,对政府制定前瞻有效的经济政策有一定参考价值。本文从中国实际出发,首先构建一个多参数动态经济
就建筑消防给水设施施工过程中的一些常见问题和消防设施的日常管理维护进行了分析,同时提出了相应的处理措施。 On the construction of fire water supply facilities in
Highcharts是一个应用于WEB的界面漂亮的纯Javascript图表库.本文介绍了Highcharts的主要功能以及应用方法,并通过应用Highcharts来实现乡镇精细预报的图示化过程,给出相应的
编者按:老年人单纯收缩期高血压病的危害性与收缩期、舒张期血压都高的高血压病有过之而无不及。今年以来,有不少读者来信就此病提出种种咨询。本刊曾请医保专家作过一些答询。由于答询复信篇幅所限,难于顾及此病的方方面面。因此,特约请罗发瑞教授撰写了《老年人单纯收缩期高血压病》一文,分两期刊登。   过去相当一段时间,人们认为老年人的收缩期血压(即上面的血压)是随年龄增长而升高的生理变化。现代科学证实,这种认
出口退税政策作为一项出口激励措施,为WTO规则所认可并在世界范围内广泛采用,从1994年税制改革至今,我国的出口退税政策对外贸出口和经济增长起到了巨大的推动作用,出口退税
中国作为一个发展中国家,近几年来经济取得了巨大的成效。同时中国房地产业运行呈现出较快的发展。作为一个举足轻重的产业,房地产业在国民经济中的地位日益显著,成为地方经济发
2009年5月,中国大陆国务院《关于支持福建省加快建设海峡西岸经济区的若干意见》赋予福建对台先行先试的权限,允许福建省采取更灵活开放的政策,探索进行两岸区域合作试点。根
网络微视频是当下网络与多媒体的热点之一,由于符合现代社会快节奏生活方式,并且能够使当今注意力稀缺时代消费者在自主参与感和注意力回报率方面得到满足,这种短而精的微视
按照国机集团关于企业改革改组工作的总体部署和要求,经国机集团领导研究决定,于2002年末,对杭州照相机械研究所和沈阳仪表科学研究院实施资产优化重组。2002年12月12日,国