应用数据填充缓解稀疏问题实现个性化推荐

来源 :第18届全国信息存储技术学术会议 | 被引量 : 0次 | 上传用户:sjzafei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  协同过滤是到目前为止最成功和应用最广泛的推荐技术,然而,由于用户-项目矩阵极端稀疏导致推荐不精确.针对该问题,本文提出了三种数据填充方法和两种推荐策略.对评分矩阵中未评分数据的三种数据填充方法是:(1)采用行和列数据的加权平均值填充;(2)采用行和列数据的众数的平均值填充;(3)采用行和列数据的中位数的平均值填充.一种推荐策略是直接用填充数据作为预测评分进行推荐;另一种推荐策略是将填充数据后的评分矩阵作为伪评分矩阵应用Pearson相关相似性进行协同过滤推荐.采用GroupLens数据集进行的实验结果表明:上述几种推荐策略均可有效地缓解评分数据稀疏性问题,提高推荐精确度.从平均的预测精确度来看,直接采用三种填充数据作为预测评分进行推荐比传统的基于Pearson相关相似性的协同过滤推荐算法分别提高了3.76%、6.46%和7.63%.;而将填充数据后的评分矩阵作为伪评分矩阵应用Pearson相关相似性进行协同过滤推荐则比传统的基于Pearson相关相似性的协同过滤推荐算法分别提高了6.57%、6.52%和7.60%.
其他文献
职场是一个竞争非常激烈的地方,有的人善于人际交往,工作起来游刃有余,有的人在职场中表现不佳,工作业绩也一直上不去。下面给大家介绍十种职场中最要不得的幼稚心理。1.只会
近年来国内外多项临床及实验研究均提示电刺激小脑顶核,具有明显改善大脑血流、缩小梗死面积、减轻缺血性损害等功效.本文旨在观察电刺激小脑顶核对脑梗塞恢复期患者运动功能
会议
  本文概述了卒中后疲劳的病理机制及其对预后的影响,介绍了其抗抑郁药物、兴奋网习犬激活系纬的药物、金刚烷胺、植物药及中成药等药物的治疗及疗效,同时描述了非药物治疗中
  在torus网络中气泡流控是一种有效、实用的死锁避免技术。关键气泡机制使用虚跨步技术,只需要使用一个报文缓冲区就可以避免torus网络中的环内死锁,但是却存在阻塞的可能。
会议
TD-SCDMA的中文含义为时分同步码分多址接入,该项通信技术也属于一种无线通信的技术标准,它是由中国第一次提出并在此无线传输技术(RTT)的基础上与国际合作,完成了TD-SCDMA标
  本综述目的是确定卒中后的第一个月不能行走的患者成为独立行走的概率。共有26项研究,荟萃分析显示,对卒中后的第一个月内在康复卒中单元和急性卒中单元内不能行走的患者,卒
会议
  本文简述了神经发育与神经再生研究的关系,介绍了神经发育研究的理想模式生物,分析了神经发育研究的方法,并探讨了目前有关神经发育研究的成果。BMP, Wnt, PI3K, Nodal, FGF
  通联关系社团挖掘是犯罪组织或恐怖组织的发现手段,在计算上通常采用图算法来实现。但是随着通联关系数量的增多,图的规模越来越大,需要分析的节点超过了数百万级,边的数量达
会议