改进的协同过滤算法及其并行化实现

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:swzzhn01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决海量数据背景下推荐系统的可扩展性问题和评分空间上的数据稀疏性问题,研究Spark平台下基于格拉斯曼秩1更新子空间估计法(GROUSE)和用户聚类的改进协同过滤推荐算法(CF-GUC)。通过改造GROUSE算法对评分矩阵进行填充;构造用户项目类别矩阵,对用户进行模糊聚类;引入类别加权度,对评分进行加权修正,在此基础上应用协同过滤算法进行预测评分;将改进算法在Spark计算平台上做并行化实现。实验结果表明,当最近邻居数 k 取30到40时,CF-GUC算法相比于CF-mean算法、CF-UC算法、Pea
其他文献
近期,为男士提供个性化服饰搭配的英国电商Thread获800万美金A轮融资。一旦你捉住男性的心思,便能在庞大的男性服装消费市场分得一杯羹。正在上映的好莱坞大片《碟中谍5》中,
11月11日。淘宝天猫“双十一”以惊人的191亿元收官,我们不由得感叹“散户”消费能力。在经济增长放缓的情况下,是谁在推动消费的增长?波士顿咨询公司(BCG)近日在北京发布的报告指
大学生是国家经济发展的中坚力量,大学生高质量就业也是解决当前就业难问题和经济结构性矛盾的重要抓手,更是实现稳就业的基础。当前,大学生和用人单位出现的"没岗位和招不来
为提高跨语言查询扩展检索精度,在原有跨语言查询扩展基础上,引入降低噪声和孤立点的k-medoid聚类算法,提出避免语义信息丢失或过拟合的择优模型。构建若干个不同维度值的d维模
习近平总书记指出,要坚持科技强审,加强审计信息化建设。笔者以审计实务视角,剖析加强审计信息化建设的紧迫性;探讨审计信息化建设中存在的亟待解决的问题;并积极探讨解决上
报纸
目的:了解某航天企业员工高血压患病率及各亚型的分布状况,分析其影响因素,为高血压防治提供依据。方法:采用体检软件导出体检数据,用SPSS软件分析高血压的分布及临床特征。结
通过文献资料法,现场观察法.录像观察法等,对两队第一阵容球员的攻守能力及特点进行分析,并对每个球员的优缺点和防守策略方面进行比较,对场上2支球队的得分区域,技战术变化进行了
核磷蛋白(NPM)是一种多功能蛋白质,参与核糖体的生物合成,控制中心体复制,具有分子伴侣作用,并通过多种信号通路调节细胞增殖和凋亡。人体内NPM的突变、其所在的5号染色体发生异位
齐武帝永明五年(487)春,沈约奉敕重撰刘宋国史,此时上距宋孝武帝大明六年(462)徐爰受诏续纂《宋书》不过二十余年。这次重修固然与徐《书》叙事不够完整——“自永光以来,至
本文通过对各供电服务渠道的应用率、运营成本、服务质量、资源配置的量化分析,形成服务能力、客户感知、服务效益、应用前景和管控质量的五大关键指标体系,再采用层次分析法