面向稀疏数据的加权slope one算法改进研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:areschicken
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术不断发展,产生的数据量越来越多,人们如何快速而准确的找到感兴趣的信息变得越来越困难,而推荐系统能有效解决该问题。但是,推荐系统持续发展的同时依然面临许多问题,如数据稀疏性问题、冷启动问题等。本文主要以加权slope one算法为研究基础。加权slope one算法是协同过滤算法的一种,其主要依靠项目评分数值差,采用线性方式进行预测。此方法计算简洁,但是在数据稀疏时效果较差,因此针对加权slope one算法存在的问题以及数据稀疏性问题,本文进行如下研究:(1)加权slope one算法仅仅考虑评分用户数量对结果的影响,并没有考虑用户或项目自身内在联系,因此,本文考虑用户相似度对结果的影响。此外,由于传统相似度计算方式如皮尔逊相关系数、余弦相似度等,在计算相似度时主要依赖用户共同评分,当共同评分很少甚至没有时,此时运用传统相似度计算方式取得的结果较差,因此,本文提出一种融合巴氏系数的加权slope one算法(BCWSOA)。从两方面进行改进:一是利用巴氏系数改进用户相似度,首先使用巴氏系数分析用户相关性计算出全局相似度,再与传统相似度计算方法加权融合,得到最终用户相似度;二是利用巴氏系数优化预测评分公式,用巴氏系数计算项目相似度,并将其作为权重因子优化预测评分公式。(2)针对加权slope one算法中数据稀疏性问题,常用的解决方法有矩阵填充。目前,大多数填充是采用数据的平均数、中位数和众数等方式。虽然可以缓解数据稀疏问题,但是这些填充方法未考虑用户和项目本身特性,未考虑用户评分易受主观性以及环境等其他因素的影响,从而导致用户对项目的评分不准确。由于项目属性是固定不变的,因此,可以根据用户对项目属性的偏好,间接体现用户对项目的喜好,故本文提出一种新的评分矩阵填充方法。首先计算用户对项目属性的偏好值,再联合用户平均评分,最后填充评分矩阵。基于填充后的评分矩阵,又考虑到用户兴趣爱好随时间动态变化,于是引入时间因子变量,故第四章提出一种基于评分矩阵填充和时间因子的加权slope one算法(FTWSOA)。本文算法以加权slope one算法为基准,为验证提出的BCWSOA和FTWSOA两种算法,通过在Movie Lens数据集上实验,结果表明:BCWSOA和FTWSOA两种算法相比于其他算法在MAE和RMSE两个指标上均有更好的效果。
其他文献
血管组织工程为解决心血管疾病移植物来源不足问题提供了新的途径。目前,小直径血管在临床上应用还存在血栓等问题,因此选择合适的材料和方法制备性能良好的组织工程支架是解决该问题的关键。理想的支架材料应当对人体无毒无害,具有良好的力学性能、血液相容性和生物活性,即支持细胞的黏附和生长,最终内皮化。肽类材料由于良好的生物相容性和生物活性广泛用于支架的研究,然而由于天然多肽提纯过程中存在从异体获得病毒的可能性
降钙素受体(calcitonin receptor,CTR)是属于S类(Secretin,分泌素类)G蛋白偶联受体(G protein coupled receptor,GPCR)家族中的一员,广泛分布,在人体各个组织和器官中,如肾脏、肾上腺、肠等都都有表达。研究表明,CTR的主要功能包括:维持肌肉干细胞的静止状态,限制骨质流失以及促进破骨细胞存活,并且它还是临床上治疗骨质疏松、高血钙症等慢性病的
随着云计算的不断发展和成熟,越来越多的企业倾向于将自己的业务系统部署于云平台来降低运营成本。云平台的资源通常封装在虚拟机中,虚拟机发生故障会导致云平台不能正常为用户提供服务。而随着云平台规模的增大,云平台中虚拟机在运行的时候容易出现故障和性能下降的情况,云服务的可用性已经成为目前云计算面临的首要问题。本文针对云平台中负载的特性以及现有云平台故障预测技术中存在的问题,将LSTM时间序列预测模型与统计
单一图像超分辨率算法指对低分辨率图像进行超分辨率处理,重建出具有放大因子倍数大小的分辨率图片的技术。近年来生成式对抗网络被引入到单一图像超分辨率任务中,该类算法能够重建出令人印象深刻的符合人眼视觉感官的清晰图片。SRGAN算法是该类算法中具有开创性意义的工作,然而该类算法的重建图片可能会产生伪影,细节部分模糊,与参考图片的感知相似程度较低等问题。为改善上述问题,本文通过对SRGAN算法的深入研究,
随着收入和科技水平增加,人们对身体健康愈发重视的同时各种医疗检验项目也愈发繁多,这导致血样标本管理流水线每天都有着巨大的检验量。为了减轻检验部门的负担、避免医护人员直接和血样进行接触,设计了一款托盘转运车用以解决血样试管托盘转运的问题。本文针对托盘转运车控制的相关问题进行研究,使其能够在上位机的命令下成功完成采血试管托盘的取放、转移、存储等工作,与其他相关设备配合实现采血试管分拣流水线的全自动化。
并联机构在承载能力、工作精度等方面表现卓著,是先进制造业的研究热点,而随着科技的进步,各行业对并联机构的要求也越来越高,轻质高效是当下并联机构的发展趋势。由于质量的减小,并联机构中构件的柔性难免增大,将其视为传统刚体系统进行理论研究已经不能满足其性能要求,因此需要考虑柔性构件发生的弹性变形对系统性能的影响。本文针对课题需求,对模型回收装置中的3-UPU并联机械手臂进行运动学、刚体动力学、弹性动力学
鱼类作为一种广泛存在于自然中的脊椎动物,具有游动速度快、机动性高、游动效率高、巡游时间长等传统水下机器人不可比拟的优势;吸引了国内外众多学者对其游动机理进行研究。本课题选择鲔科模式鱼类作为仿生对象,针对现有仿生鱼驱动结构存在的弊端,结合电磁驱动器优点,设计了一种基于电磁驱动的仿生金枪鱼,对鲔科模式鱼类在高频摆动下的游动特征进行了相关研究。首先本文借助现有仿生鱼的运动学分析与控制方法,完成了仿生金枪
本课题以同轴结构传输线的温度特性和频率特性为理论基础,解决了高温高频条件下对固体薄片结构的样品的阻抗测量问题。主要研究对象为课题组自主设计并加工完成的全金属同轴结构夹具,并对其测量过程中产生的误差进行分析。在高温高频条件下,采用分布参数的分析方法推导出夹具末端的样品阻抗值。由于测量过程中高温及高频下产生的热胀冷缩、多次反射、电延迟等物理现象的影响,本课题从理论层面提出补偿修正计算,从而提高固体薄片
近年来,永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)的无传感器控制作为可望提高电机工作可靠性和容错性的一种重要手段,备受人们研究关注。实际PMSM受系统参数时变、负载摄动等不确定性扰动因素影响。现有的无传感器控制方法尚存在转子状态(转速和位置)观测精度不高、鲁棒性不强等不足,导致无法获得优良的PMSM无传感器速度控制性能。本文从研究提高无传感器控制
随着互联网技术的快速发展和移动设备的普及,人们网上的交流也越来越频繁,这导致网络信息迅速的增长。在如此庞大的数据量中找到有价值的信息变的非常困难。推荐系统就是一种有效解决该问题的方法。它不仅帮助用户快速检索,同时在商业领域有着广泛的应用,为众多公司带来利润,因此受到许多研究机构的重视。高效的推荐方法不仅具有实用性,同时还具有很高的商业价值。本文将深度学习与传统的推荐方法进行结合,提出了一种F-LF