协同过滤推荐系统的数据稀疏性问题研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:sunshine123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,使得获得信息的途径逐渐增多,在给人们带来便利的同时,海量的信息也覆盖了人们的日常生活,“信息过载”成为了不容忽视的现实问题。如何能够在信息海洋中快速、准确的找到用户所需要的信息成为目前研究的热点问题。为了解决这一问题,个性化推荐系统因运而生,成为继搜索引擎后一种获取信息的重要方式。个性化推荐系统包括很多类型,应用最广泛的是协同过滤推荐,其优点主要包括计算简单、易实现等。另一方面,数据稀疏性、冷启动、用户兴趣波动等因素直接制约了推荐结果的准确性。因此,怎样进一步提高推荐的准确性成为一个亟待解决的难题。为了解决上述的问题,许多具有代表性的有效推荐算法被提了出来,例如邓爱林等人提出的一种基于项目评分预测的协同过滤推荐算法;Sarwar等人提出的评分矩阵填值的方法等。但是在传统的协同过滤推荐算法中没有将用户-项目评分矩阵数据稀疏,用户之间共同评分项目稀少这一状况考虑在内,当出现该情况时使用传统的相似度计算方法将会导致推荐结果出现精确度不高的现象。针对该问题,本文提出了结合用户的评分时间来发现具有相似评分行为的用户,从而改善传统协同过滤算法中寻找最近邻的方法,该方法相比传统的基于用户的协同过滤算法平均绝对误差降低了 1.89%;提出了融和用户评分方差相似度的改进算法,从而更全面地利用用户评分信息来改善相似度的计算,该方法使得平均绝对误差降低了 1.94%;提出了在结合用户评分的基础上融合用户评分方差的改进算法,该算法使得平均绝对误差降低了 2.19%。通过实验的结果可知,即使在数据稀疏、用户之间共同评分稀少的前提下改进的算法依然能相对准确的计算用户之间的相似度,达到提高推荐准确性的目的。。
其他文献
目的 探讨血清miR-21是否可成为结直肠癌患者的肿瘤标志物.方法 以miR-16为内参,采用实时荧光定量PCR的方法检测miR-21在40例结直肠癌患者、29例良性结直肠疾病患者和27例健
促进产业结构与就业结构相协调,是实现我国产业结构优化调整和劳动力充分就业的根本途径.分析济南市产业结构和就业结构的演变过程及其特征、产业结构与就业结构的平衡性、产
为了初步研究辣椒(Capsicum annuum L.)NRAMP家族基因在重金属镉胁迫下的表达情况,通过生物信息学方法从辣椒基因组中鉴定出NRAMP基因,并对这些基因的序列结构、系统进化树、
采用各向异性水平层状介质磁偶极子源并矢格林函数计算接收线圈倾斜的随钻电磁波电阻率仪器的响应,利用新的方式定义出定向相位差及幅度比信号。分析视电阻率以及定向信号的
膝关节骨性关节炎(OA)是世界上最常见的关节炎,其发病率逐年上升。不断上涨的治疗费用给患者带来了经济负担。膝关节OA治疗的两个早期干预目标是减轻膝关节的疼痛和关节软骨
据工信部网站消息,2016年,建材行业经济运行呈现筑底回升、稳中向好势头,主要产品生产增速平稳,价格理性回升,经济效益持续好转,发展质量有所改善。但产能过剩矛盾没有根本缓
从理论和实验上研究了压电微动步进器的运动条件和运动速度,结果表明加在步进器上的电压变化率的临界值不仅限制了步进器的最大运动速度,也决定了步进器的运动条件,所设计的步进
PM2.5能够透过人体组织,对健康产生重要影响,研究环境空气中PM2.5的污染特征具有实际意义。以遂宁市大气连续采样监测数据为基础,利用SPSS软件对可吸入颗粒物PM10和细颗粒物P
对上海动物园斑嘴环企鹅的人工孵化和育雏进行了连续3年的研究,此期共产卵20枚,最终成活8只.斑嘴环企鹅卵纵径平均值72.4mm,横径平均值52mm,卵重平均值为107.1g,卵壳厚度平均
以陕西凤县地区基础地质资料、煤系石墨矿露头和煤矿资料为依据,通过野外地质调查、煤系石墨矿老硐编录及测试分析,运用地质综合分析方法。研究结果表明,陕西凤县煤系石墨矿