基于协同过滤的推荐算法研究与系统实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:liyanhao1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对日益严重的“信息过载”问题,很多研究提出使用信息检索技术来解决,但是该技术仍有对搜索关键词依赖和无法提供个性化服务等问题。为了解决上述问题,推荐系统被提出。其中协同过滤算法是推荐系统中常用的一种推荐算法,但是仍面临着数据稀疏性、冷启动、可扩展性和评分数据本身的局限性等挑战。因此,本文以上述存在的问题为出发点,结合不同的分析方法,融合多源信息,在基于内存和基于矩阵分解的两种传统CF算法的基础上进行了研究、改进和实践应用。工作内容如下:研究了基于聚类和二分网络的协同过滤模型(Collaborative Filtering model based on Clustering and Bipartite Network,CBNRank)在缓解协同过滤算法中数据稀疏性、可扩展性和评分数据本身的局限性问题的效果。首先,使用聚类和协同过滤组合算法处理评分数据,对用户聚类,在每个聚类簇中利用基于用户协同过滤算法填充该评分矩阵,以降低算法的运算时间和数据的稀疏度。然后,将评分数据处理为成对偏好数据集,构建相应的二分网络结构,以缓解评分数据本身的局限性问题。最后,利用基于图的排名算法计算项目之间的相似度,实现Top N推荐。实验结果表明CBNRank模型对于缓解上述问题起到了积极的作用,提升了预测精准度。研究了基于多源信息和深度矩阵分解的协同过滤模型(Collaborative Filtering model based on Multi-source Information and Deep Matrix Factorization,MIDMFRank)在缓解协同过滤算法中数据稀疏性和冷启动问题的效果。首先,分别将用户和项目信息通过不同网络层的处理,得到用户和项目特征。然后,将评分数据作为深度矩阵分解模型的输入,分别学习到用户和项目隐特征,将用户和项目特征分别融合到用户和项目隐特征中,通过融合后的隐特征继续训练模型,以缓解冷启动问题。最后,根据归一化交叉熵损失函数继续学习,得到最终的评分预测矩阵,实现Top N推荐。实验结果表明MIDMFRank模型对于缓解上述问题有促进作用,提高了评分预测精度。设计了基于MIDMFRank模型的电影推荐系统。该系统以需求为出发点,设计了整体架构、功能模块和数据库,最终实现了推荐服务,验证了MIDMFRank模型在实践应用中的可行性。
其他文献
硅藻土(De)作为一种天然矿物粘土,储量丰富,开采成本低,具有丰富发达的多孔结构,具有一定的吸附能力,常用作吸附材料处理印染废水。然而天然硅藻土,吸附容量有限,而且一般带负
改革开放40余年来,伴随国民经济的高速发展,中国的环境污染和能源消耗问题异常严重。依托蕴藏丰富的能源与矿产资源而成长起来的资源型企业,随着产业布局的不断演变,资源禀赋
目的 探讨吸入激素和β2受体激动剂在婴幼儿哮喘急性发作治疗中的疗效。方法 治疗组35例,对照组30例,治疗组在常规抗感染基础上加用布地奈德与0.5%沙丁胺醇,常规组在常规抗感染
目的:探讨个体化护理对脊髓损伤患者神经源性膀胱康复的影响。方法:70例脊髓损伤所致的神经原性膀胱患者随机分为治疗组和对照组各35例。对照组给予常规护理,治疗组给予个体化护
当今世界随着对文化创意产业的重视,在国家文化产业重大政策发布,文化发展重大会议召开以及国际环境急剧变化的时代背景等现实驱动下,中国文化创意产业发展态势良好,在政策、经济、社会、科技等条件的共同支持下,推动了文创产业的积极发展。文化产业的学术研究随之成为研究的热点。在这个大环境下,作为文化创意产品开发重要组成之一的高校图书馆,其文化创意工作也需加快发展。2016年,我国国家图书馆设立文创店“国图旺店
算法,新教材增加的内容之一.不仅是数学及其运用的重要组成部分,也是计算机科学的重要基础.近几年高考,算法作为新增知识,一点点与其他知识交汇融合,一步步渗透应用,成为高中数学新教
当今世界衡量一个国家的制造能力,精密机械加工技术便是重要指标之一。而仪器设备作为实现精密机械加工的重要工具,其精确度、稳定性、安全性等也与制造能力的提升息息相关。仪器设备广泛应用于工业生产以及研发中,其中也包含化工企业。化工作为梅特勒-托利多的战略开发行业,其重要性不言而喻。如何更好地、更深程度地开发化工客户成为梅特勒-托利多管理层时常讨论的话题。在过去的3年,梅特勒-托利多在化工行业出现的业绩下