基于深度学习的协同过滤算法研究与改进

来源 :中国民航大学 | 被引量 : 1次 | 上传用户:saiuggidia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统的核心是推荐算法,协同过滤算法因其简单、高效、稳定的特点在所有推荐算法中备受青睐,也是目前推荐算法中应用最广泛最成功的推荐技术。但是在实际应用场景下,随着用户和商品的不断增长,协同过滤算法中的评分矩阵逐渐暴露出数据稀疏性和冷启动问题,同时也忽略了评论文本中的大量信息。此外,协同过滤推荐算法仅利用浅层特征来训练模型,制约了推荐性能。近五年来随着深度学习的崛起,掀起了人工智能的热潮。在图像识别领域、文本挖掘领域、语音识别领域均取得了突破性进展,这也为提升推荐算法性能带来可能。本文的主要工作包含以下两个部分:(1)针对传统协同过滤推荐算法中存在的冷启动与数据稀疏性问题,以及在矩阵分解时降维程度主要依赖于先验知识缺乏灵活性这一弊端,提出了融入奇异值能量的协同过滤算法(SVE-CF)。首先在数据预处理过程中计算出用户-项目评分矩阵的噪声率,根据噪声率确定评分矩阵替换程度,再利用奇异值能量求得近似评分矩阵,最后通过矩阵因子分解模型将近似矩阵中的用户和商品映射到同一隐空间,确定两者之间的交互,实现了基于评分的推荐。在公共数据集Movie Lens上验证SVE-CF模型和多个传统推荐算法效果,结果表明SVE-CF模型的RMSE、MAE测量指标平均降低了约3%,同时有效缓解了数据稀疏性和冷启动带来的影响。(2)首先对传统协同过滤推荐算法和经典深度学习模型进行了研究,并在此基础上设计实现了新的推荐算法模型,提出了融合用户和商品评论的双通道CNN推荐算法(C-DCNN,Combine-Double CNN)。首先将用户和商品评论文本矢量化为词向量,再分别使用两个CNN网络对用户和物品进行特征提取,然后在共享层通过点积项将用户和物品的抽象特征映射到同一特征空间,最终预测出用户对特定商品的评分。经在Amazon、Yelp、Beer三组公共数据集上进行实验后,其结果表明该模型在不同数据集上的MSE都比其他基准算法更小,且有效缓解了数据稀疏性问题。
其他文献
棉田在使用除草剂时,因选药不当或天气状况不良,或施药方法不合理,每年都有棉农反映遭受药害现象。现将一些常用除草剂在棉花上引起的药害症状及预防措施介绍如下:
在肖邦钢琴作品中,和弦外音起到了十分重要的作用,它不仅调节和丰富了音乐的音响色彩,还加强了音乐华丽流动的叙述特性。本文将通过大量实例的分析,从而解析肖邦钢琴作品中和
随着社会的不断进步与发展,英语教学已经成为了各个中小学生乃至大学的主要教学科目。对于大学的英语教学来说,最重要的就是英语口语教学,英语作为一门口语知识,学习的最终目
本文梳理了我国二元经济问题研究的四种观点:二元经济结构论、三元经济结构论、四元经济结构论、环二元经济结构论.然后从四个方面对这些研究进行了评价,这些评价基本上是批
现今我国在民航的自主研发方面取得了一定成就,尤其是在大飞机C919的试飞成功后,更加证明我国在民航业的发展越来越好。飞机为了取得适航审定合格证,各方面的测定都需要满足民航规章中的要求,规章中对于噪声的规定是对于整个飞机所产生的噪声而言。随着喷流噪声的减小,燃烧室产生的噪声越来越引起人们的重视。然而燃烧室噪声是无法通过实验直接获得的,因此通过预测对燃烧室噪声进行研究变得尤为重要。飞行状态下燃烧室噪声
<正> 不发火花地面一般又称作防爆地面,主要用于有防火、防爆要求的车间和仓库,如化学工厂的钾、钠、氢生产车间,军工厂的火工车间,煤气生产厂的煤气生产车间,以及粮食、棉花
目的观察防风通圣汤联合西药治疗胃肠湿热型慢性荨麻疹的临床疗效。方法60例符合纳入标准的荨麻疹患者随机分为治疗组和对照组各30例,治疗组给予防风通圣汤联合西药治疗,对照
孔子是最为优秀、最为成功的道德教育家。孔子道德教育的成功基于2个方面的原因:一是"折中"色彩和"主德主义"的教育理想的设计;二是从人性出发的道德教育前提和独具特色的道德教育
目的:优选运脾通便合剂提取工艺。方法:以浸膏得率以及橙皮苷、白术内酯Ⅲ含量的综合评分为指标,在单因素试验基础上,选择提取时间、提取次数和液料比为自变量,采用Box-Benhn