基于相似度计算的协同过滤推荐算法研究

来源 :河南理工大学 | 被引量 : 0次 | 上传用户:duanh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代背景下,互联网的海量数据造成了“信息过载”这一难题,用户无法快速获取对自己有价值的物品信息,推荐系统的出现缓解了这一问题,协同过滤算法作为推荐系统的核心,逐渐成为国内外专家学者研究的重点。推荐算法自身存在一定局限性,同时稀疏数据集也对其造成干扰,从而影响推荐质量,鉴于这一问题,本文对传统协同过滤算法展开研究和改进,主要工作如下:(1)针对传统协同过滤算法自身局限性导致推荐不准确问题,提出一种基于共同评分数所占比重和物品特征作为权重的改进算法。通用的相似性算法基于用户共同评分项目集来度量用户之间的相似度,在很多时候无法做出合理的推荐,本文以此提出新的思路,考虑到用户对共同评分项目的评分所占比重带来的影响,并分析评分大小所表现出来的用户兴趣,同时融合基于项目属性喜好的相似度,形成新的改进算法,通过与其他算法和传统算法相比较,实验结果证明本文改进算法有更好的性能,克服了传统算法的缺点,提高了推荐精度。(2)针对数据稀疏性对推荐质量的影响,提出一种融合用户活跃度、平均评分和共同评分的改进算法。一般的相似度计算方法在稀疏数据集中会受到较大影响,导致推荐结果的准确性有所降低。针对这一问题,本文通过引入用户活跃度,考虑了用户共同评分数和评分差异,提出一种新的计算方案,优化了协同过虑算法中相似性度量的关键性能。实验结果表明,改进算法使平均绝对误差值大幅降低,从而有效降低了稀疏数据集对推荐精度的影响,显著提高了推荐系统的推荐质量。
其他文献
目的:研究坐骨股骨撞击综合征(Ischiofemroal impingement syndrome,IFI)与股骨侧解剖相关测量参数的关系,并进一步探讨其发病机制为临床治疗提供依据。方法:回顾性分析经双
随着多媒体业务尤其是视频业务成为互联网中的主要业务,用户对多媒体视频业务的需求越来越严格,传统的1080P高清视频已逐渐无法满足消费者对高清晰度、高流畅度、高保真度视
钙离子(Ca2+)是细胞内广泛存在的第二信使,调控细胞的各种重要生理功能,如细胞的增殖分化、能量代谢、自噬、凋亡等过程。在静息状态下,细胞质内游离的Ca2+浓度约为100 n M,
随着信息技术与多媒体技术迅速发展,图像呈现指数级的增长,如何应对这些图像分类是个亟待解决的问题。现实生活中,一幅图像往往存在多义性,图像分类是典型的多标记问题。另外,在高风险领域,分类失败将导致严重的后果。本文通过把卷积神经网络(Convolutional Neural Networks,CNN)引入归纳一致性预测器学习框架(Inductive Conformal Predictor,ICP),提
背景急性B淋巴细胞白血病(Acute B-cell lymphoblastic leukemia)是好发于儿童时期最常见的血液系统恶性肿瘤。尽管目前有包括化疗、靶向治疗、移植等多种治疗手段,在一定限
VR视频,也称作360视频,是新一代的视频显示技术。用户置于球形区域的中央,可以任意地选择观看周围360度的视频场景,而不受空间和时间的限制,有一种身临其境的感觉。VR视频具
急性髓系白血病(AML)是一种造血干细胞恶性增殖引起的血液肿瘤,在我国以及全球都有着高发病率和高死亡率。作为一个高异质性疾病,筛选合适的预后因子对精准治疗AML来说十分重
背景和目的颅内动脉瘤(intracranial aneurysms,IA)是颅内血管壁破坏导致的一类复杂性疾病,随着动脉瘤的发展,IA产生破裂,引起蛛网膜下腔出血(subarachnoid hemorrhage,SAH),
目的针对2013~2017年安徽省人感染H7N9禽流感的基本情况进行流行病学的描述,并对其特征进行综合分析。对安徽省2013~2017年不同流行季内人感染H7N9禽流感病例的流行病学特征进
近年来,全球移动流量呈现爆炸式增长,视频流量在其中占了很大的比重,在高峰时段人们对于视频的请求会造成网络的拥堵,为了减轻高峰时段网络中的压力,减少视频传输对于带宽的