推荐系统中矩阵稀疏性问题的研究

来源 :北京交通大学 | 被引量 : 10次 | 上传用户:pkuericz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与过去信息的严重匮乏状况相比,当前互联网的快速发展,使得数据量急剧膨胀,而面对如此海量的信息数据,衡量一个信息系统优劣的重要指标就是是否能对信息进行精确的筛选和过滤。推荐系统作为一类为用户提供良好体验的信息系统,其核心功能是对海量信息数据进行筛选和过滤,并能够给用户展现其最关注的信息。因此解决信息筛选问题,是推荐系统最重要的问题之一。推荐系统可以解决信息过载,然而随着推荐系统规模的不断扩张,用户-项目评分矩阵表现出极端稀疏性,导致基于传统相似性度量方法的协同过滤推荐算法的推荐质量严重下降。本文针对推荐系统中评分矩阵的稀疏性进行研究,引入用户特征信息,并结合数据预处理、相似度加强和混合预测等方法,以期解决数据稀疏性给推荐系统带来的精度下降问题。本文的研究工作和创新点包括:  (1)在MovieLens数据集上,对用户评分情况、共同评分比例等信息进行了统计分析,从理论和数值两方面研究了评分数据的稀疏性特征,讨论了稀疏性问题给推荐系统性能带来的影响。  (2)提出了改进的相似度加强算法,使用SVD对初始评分数据做预处理,进而提高用户和项目的初始相似度。通过统计分析用户和项目的共同评分比重,将不同用户和不同项目间的共同评分比重与调参λ的乘积,作为初始相似度在相似度加强模型中的权重比例。在预测评分阶段,以共同评分权重混合基于用户的预测评分和基于项目的预测评分。将改进的模型在数据集上进行测试分析。结果表明,当λ取值1.6时,误差最低,最低平均绝对误差MAE达到0.7302。表明本文提出的改进的相似度加强方案可以提高推荐质量。  (3)提出了用户特征相似度模型,通过提取数据集中的用户信息数据并量化,采用基于比值的相似度算法,提炼用户特征模型,获取用户特征相似度矩阵,并加权到用户初始相似度上。数值分析结果表明,算法加入用户特征数据后,推荐误差降低了0.01左右,可以进一步提高推荐准确度,缓解稀疏性问题。  (4)实验阶段采用MATLAB仿真平台,导入MovieLens数据集中用户评分信息合成用户-项目评分矩阵,导入用户特征信息,用以提取并量化,提炼用户特征模型。首先使用SVD做数据预处理,计算初始相似度,开始算法迭代并混合预测未评分项。结果表明,本文提出的改进的相似度加强算法可以进一步解决推荐系统稀疏性问题,结合用户特征模型,可以更好的提高推荐质量。
其他文献
机械结构工作模态参数识别(Operational ModelAnalysis,简称OMA)和振动故障诊断是在工程应用中不可或缺的两个重要技术。独立分量分析(Independent ComponentAnalysis,简称ICA)作为一种统计信号数据分析工具,在无先验知识的条件下可以有效地从线性混合的复杂信号中盲分离出各个独立源信号,该技术已经在监测和诊断方向以新的研究方法被提出。本文以齿轮箱为研究
基于内容图像搜索的一个核心问题是如何正确理解用户的查询意图,并正确地建立查询图像和数据库中图像的相关关系。由于图像视觉显著性区域和用户的视觉关注有很强的关联关系,将
稻飞虱是我国水稻上重要的一类迁飞性害虫,一般集中在水稻中下部为害。掌握稻飞虱田间种群密度动态变化是准确进行稻飞虱预测预报和合理防治的关键。目前,我国稻飞虱田间测报调
随着GSM-R无线通信网络在高铁中的广泛应用,铁路的网络安全越来越受到人们的关注,RSSP-Ⅱ是我国为保证高铁开放网络安全制定的标准协议,其安全性和可靠性关乎到CTCS-3列控系
学位
高光谱图像光谱分辨率高,具有图谱合一的特性,能够提供区分不同物质的诊断性光谱信息,结合该光谱信息可提高对目标和背景进行定量分析的能力,因此高光谱目标检测技术在目标检测领域具有独特的优势。由于地物分布情况复杂和成像光谱仪空间分辨率的较低等原因,待检测的目标通常与其他地物共同组成混合像元,此时目标以亚像元形式存在。高光谱亚像元目标检测是目标检测研究的前沿和难点,本文着眼于如何利用高光谱数据的稀疏性提高
频率选择表面(Frequency Selective Surface, FSS)是一种二维周期性阵列结构,在空间电磁环境中表现出带通或带阻的滤波特性,故其常作为空间滤波器来使用。FSS广泛应用于微波
超分辨率图像重建是以同一场景的一幅或多幅低分辨率图像为输入,结合一定的先验信息,重构出一幅高分辨率图像的技术。这一技术在不改变现有硬件设备的前提下,能够有效地提高图像
在现代生活日新月异的进步中,各种高科技领域都在飞速发展,图像通信作为多媒体通信中的重点部分越来越多的获得人们的重视。传统的信源信道分离编码设计的方案,在通常情况下会使
随着网络技术的快速发展,现有的网络技术很难跟上人们对于网络的更快速、更便捷、更安全的要求。为此,各式各样的网络新技术也层出不穷。向量网络技术便是在此背景下应运而生的