应用数据填充缓解稀疏问题实现个性化推荐

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:zwb20042002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤是到目前为止最成功和应用最广泛的推荐技术,然而,由于用户-项目矩阵极端稀疏导致推荐不精确。针对该问题,提出了三种数据填充方法和两种推荐策略。对评分矩阵中未评分数据的三种数据填充方法是:(1)采用行和列数据的加权平均值填充;(2)采用行和列数据的众数的平均值填充;(3)采用行和列数据的中位数的平均值填充。一种推荐策略是直接用填充数据作为预测评分进行推荐;另一种推荐策略是将填充数据后的评分矩阵作为伪评分矩阵,应用Pearson相关相似性进行协同过滤推荐。采用MovieLens数据集进行的实验结果表明:上述几种推荐策略均可有效地缓解评分数据稀疏性问题,且提高了推荐精确度。
其他文献
大学制度在宏观方面是一种社会制度,深受一国政治体制的影响;大学的独立或自治受国家人才培养目标的制约。我们要在大学独立和国家适度干预之间寻求平衡,使大学具有更大的独
公民道德建设的实施途径应针对公民“学习生活、职业生活、家庭生活、社区内公共生活以及社区外公共生活”等五个“方面”来设置。除当前的“家庭、学校、机关企事业单位”等
结合我国炼焦煤资源短缺、分布不均及其与炼焦煤需求极不适应的背景,提出了利用煤岩显微组分分离技术实现炼焦煤资源的合理利用,综述了煤岩显微组分测定方法的研究现状,并归
浅述实现选煤厂煤泥水闭路的新途径平朔煤炭工业公司王汇泉选煤厂的煤泥水处理是工艺系统中难度较大的环节之一。因其涉及到生产管理、资源回收和环境保护等诸多方面,无论是选
基于2002-2008年省级层面十二大类(HS码)产品的出口数据,测度了28个省级区域劳动和资本密集型产业的出口技术复杂度赶超系数,进而运用门槛效应模型对赶超的经济增长效应进行
目的分析右美托咪啶在ICU镇静作用方面的临床效果。方法选取该院2012年6月-2013年6月收治的在ICU进行治疗的72例患者,随机分为两组,各36例,对照组采用咪达唑仑治疗,研究组采
本文对20世纪70年代初期在哈贝马斯和马尔库塞之间发生的那场争论进行了评论,认为马尔库塞看到了技术的两重性,这是正确的,而哈贝马斯则在重建交往理性的过程中把技术局限于
目的探讨亚低温治疗新生儿缺血缺氧性脑病的护理方法。方法将该院2013年10月—2014年6月收治的重度窒息致HIE足月新生儿50例,按选择治疗方式随机分成亚低温组和对照组,各25例
目的对外伤性脾破裂的临床急救进行分析,探讨其临床特点和预后。方法对该院收治的330例外伤性脾破裂患者临床急救及预后情况进行回顾性分析。患者入院后予以紧急诊断和处理,
随着硬件功能的不断丰富和软件开发环境的逐渐成熟,GPU在通用计算领域的应用越来越广泛,使用GPU集群来进行海量数据计算的例子不胜枚举。但是,相对于CPU,GPU的功耗较大,如果