基于矩阵分解的个性化电影推荐算法研究

来源 :哈尔滨理工大学 | 被引量 : 1次 | 上传用户:high
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代背景下,随着信息的数量和种类迅速增长,使得信息需要花费大量的时间寻找,以得到感兴趣或者有用的信息,出现信息过载问题。随着个性化推荐系统的出现,信息过载问题得到了缓解。近年来出现大量推荐系统的相关研究,由于矩阵分解技术的推荐准确率高、可扩展性强、运行速度快等优点,其迅速成为推荐算法领域中的研究热点。论文基于混合推荐算法的原理改进了传统相似度计算,从距离的角度考虑推荐问题,改进了概率矩阵分解算法,基于近邻推荐算法的思想改进了贝叶斯个性化排序算法。论文首先利用兴趣漂移因子和热门物品因子通过加权方式改进了Pearson相似度,利用奇异值分解算法得到了用户隐特征矩阵,通过余弦相似度计算用户的隐特征相似度,利用Hellinger Distance分析用户之间的评分分布相似度,并且以此作为改进的Pearson相似度的权重与隐特征相似度结合,提出了基于Hellinger Distance改进相似度的协同过滤算法(CFHPI)。通过实验,分别与传统的Pearson相似度、Jaccard相似度以及NCF算法进行对比,结果表明CFHPI算法的MAE达到了0.769,比其它三种算法最少降低了0.015,Recall值达到了0.187,比其它三种算法最少提高了0.011,证明CFHPI算法确实提高了用户相似度的准确性。论文进一步从距离的角度预测评分,通过用户特征向量与项目特征向量之间的距离度量用户对电影的喜好,并且基于近邻推荐算法的思想对用户评分的信任度进行了分析,为每个评分计算全局信任度。由此本文提出了基于距离和信任度的概率矩阵分解算法(DTPMF),通过实验,在两个数据集上分别与SVD、PMF和bias PMF算法对比,DTPMF在RMSE值分别达到0.915和0.867,比其它三种算法在Movielens_100k上至少降低了0.013,在Movielens_1M上至少降低了0.022,证明DTPMF在提高评分预测的准确性的优越性。为了更加精确的表示用户对项目的偏好,本文基于近邻推荐算法的思想,构建了用户近邻矩阵,并且结合原评分矩阵将用户对项目的偏好分为高偏好、中偏好和低偏好三类。根据划分的三类偏好为BPR算法构建三元组然后进行优化求解,本文提出了一种基于近邻矩阵改进的贝叶斯个性化排序算法(NBPR)。通过实验,在两个数据集上分别与BPR,MBPR和pop Rank算法进行对比,NBPR算法的Recall值分别为0.089和0.076,相比于其它两个算法在两个数据集上分别至少高出了0.017和0.013,Precision值分别为0.41和0.46,相比于其它两个算法在两个数据集上分别至少提高了0.017和0.012,证明NBPR算法在提高排序预测准确性的优势。
其他文献
2015年3月,国务院颁布《关于印发中国足球改革发展总体方案的通知》,标志着足球发展首次上升为国家战略,迎来了校园足球活动的快速发展,因此与之配套的公共服务供给成为研究
短期水火电调度(Short-term Hydrothermal Scheduling,STHS)是一个非线性、多维、多约束且时变的优化问题,当将阀点效应引入后该问题变得非凸从而更加复杂。论文以求解火电站
诗歌是语言表达的最美丽形式。它是诗人情感和才华的集中体现。学习诗歌不仅可以提高学生的综合语文素养,还可以培养他们对语文的浓厚兴趣,激发他们对美好生活和自然的热爱和
高中生在数学解题中常常伴随着解题错误现象的产生,学生在数学学习中发生数学解题错误是不可避免的,教师应当承认学生错误的合理性,并利用好学生的错误进行教学。对学生在解一元二次不等式中发生的错误进行研究,不仅能够对数学教师的教学提供指导,也能够切实帮助学生减少数学解题错误的发生。解一元二次不等式的内容是高中数学学习的重点和难点,它既是初中解一元一次不等式内容的延伸,也是对前面学习过的集合知识的巩固和运用
实Bott流形是一个平坦流形,这意味着在它上面存在一个截面曲率处处为0的黎曼度量。于是由于所有具有平坦黎曼度量的闭流形都是边界这一事实,一个实Bott流形是另一个流形的边界。但是由如上方法仍然不能给出一般的广义(实)Bott流形是不是边界。在这篇文章中,我们将首先用另一种方法证明一个实Bott流形是另一个流形的边界,而后我们将把其证明推广到一般来说明某些广义(实)Bott流形,也就是在一个单形乘积
医疗质量是医疗服务的核心内容,是医疗安全的根本保障。健全医疗服务体系,保证公民能够平等、及时、连续地得到优质的医疗服务,是政府重要的行政职能,对医疗质量的有效治理,
一直以来,半刚性基层承担着高等级沥青路面的主要承重层作用,使用比较广泛,水泥稳定碎石作为其重要的代表,以其良好的水稳定性、较高的强度、较大的承载力等优点得到普遍应用。然而水稳基层在使用过程中容易出现裂缝,在一定程度影响了其耐久性。因此,提高水泥稳定碎石基层耐久性的重要环节就是采取怎样的措施来解决水泥稳定碎石基层裂缝相关问题。原材料的质量保证是水泥稳定碎石基层裂缝减少的前提,客观上已经得到了解决,因
电能作为当今社会主要的能源形式之一,对日常生产生活起着不可替代的作用。随着越来越多的非线性电力设备接入电网系统,电网系统电能质量受到严重威胁。而有源电力滤波器作为改善电能质量的重要装置,其本身输出电流质量对于补偿效果的重要性不言而喻。介于此,本文对单相并联型有源电力滤波器非期望谐波电流抑制策略展开研究。本文首先建立了单相并联型有源电力滤波器连续域和离散域数学模型,并验证了相关数学模型的准确性。然后
行为识别的主要目标是在输入的若干个行为的视频中提取出有效的运动特征,并通过对这些特征进行分析,从而快速准确的识别出该行为的所属类型。行为因素在考核家畜健康和商业利益评价中至关重要,因此,牲畜的行为识别技术现在已经广泛应用于规模化的畜牧养殖业中,但在近年来学者的研究中,我们发现家畜的行为识别过程中,提取的代表动物行为的特征点出现冗余情况,对识别的结果有一定的影响;另外,不同的字典学习在行为识别中的计
随着社会经济快速发展,车辆保有量急剧增加,交通系统面临的问题日益严峻复杂。由多个车辆形成队列行驶是一种有效缓解交通系统压力的解决方案。因此,如何针对车辆队列进行理