基于机器学习的商品评分预测

来源 :兰州交通大学 | 被引量 : 1次 | 上传用户:zhangshuai5365
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当代互联网技术的飞速发展和互联网信息的快速传播,推荐系统已经成为帮助用户获取有效信息的重要手段。协同过滤算法是推荐系统最常用的技术手段,但是传统的协同过滤推荐算法受限于其评分矩阵的稀疏性,在用户和商品数量庞大的情况下无法产生有效的推荐。矩阵分解及其改进模型可以从评分矩阵中提取用户和商品的隐含因子特征,通过评分预测来填充评分矩阵中的缺失值,从而解决了协同过滤算法稀疏性高、推荐性能低的问题。除了用户对商品的评分数据之外,用户对商品的评论文本也反应了用户对商品的喜好以及商品的特征,因此研究人员提出了许多基于文本特征提取的评分预测方法以缓解评分矩阵的稀疏性。但是,以上方法仅单一的使用了评分矩阵或者评论文本来进行评分预测,而没有将两者结合起来进行综合考虑,因此,预测精度的提升有限。为了进一步提高评分预测精度,缓解评分矩阵稀疏性,提升推荐质量,论文提出了一种融合了用户-商品评分矩阵和评论文本的Deep-Fusion评分预测模型,Deep-Fusion模型由矩阵分解模块、深度矩阵分解模块和文本特征提取模块组成,其中矩阵分解模块将评分矩阵中的每个用户和商品分别映射成两个隐含因子向量,并将这个两个向量进行内积运算对用户和商品间的线性关系建模;深度矩阵分解模块将用户和商品隐含因子向量输入多层神经网络,通过每层的非线性激活函数学习用户和商品之间的非线性关系;文本提取模块采用两个并行的卷积神经网络分别提取评论文本中的用户偏好特征和商品属性特征,然后在融合层融合三个模块的输出,最后通过全连接层输出用户对商品的预测评分。论文最后在亚马逊的五个商品评论数据集上将提出模型与其它评分预测模型进行了实验对比分析,对影响模型性能的参数进行了对比选择,以均方误差、准确率、精确率、召回率、F1值作为评价指标从评分预测的精确度的和推荐列表的准确性两方面进行评估。实验结果表明,Deep-Fusion评分预测模型在不同测试集上的预测均方误差均低于其它对比模型,且推荐效果更好。
其他文献
日益复杂的多媒体与科学计算需求,迫切需要计算机具有更强大的计算能力,单受半导体工艺的限制,单纯通过提高工作频率提升处理器性能的方法,已经难以满足人们日益增长的对处理
随着无线通信的迅速发展,用户数据量骤增以及无线频率资源的紧张,引发了许多通信中的问题。首先是由于多径和高速移动造成的时频双选择性衰落信道,会对信号带来严重的损伤,带
随着信息和通信技术的迅速发展,人们对通信系统保密性能的要求日渐增高,信息安全问题得到了重点关注和研究。目前主流保密机制主要依托于以密码学为核心的加密方法,其发展十
步态识别是一种利用行人走路姿态进行识别或者辅助鉴别身份的生物特征识别方法。相比其他方法有其独特的优势,具有广阔的应用前景。但在步态识别的研究过程中,仍有许多问题有
换热设备广泛应用于冶金、电力、化工、航空等工业生产领域。随着换热设备运行,在管壁会逐渐形成污垢,污垢的存在将导致换热设备传热效率降低,增加能源消耗,同时也会给换热设
本文通过溶液共混的方法制备了聚乳酸(PLA)/含离子液体基元齐聚物(IL)和聚乳酸(PLA)/聚己内酯(PCL)/IL共混物试样。利用差示扫描量热仪(DSC)、偏光显微镜(POM)、X射线衍射仪(
随着民用航空的迅猛发展,飞机数量日趋增多,飞行流量不断加大。若同一时间同一空域的飞机航线密集,很容易造成空中交通拥堵,严重时可能诱发事故。因此,对民航管制的要求也越
习近平总书记在参观红军长征湘江战役纪念馆时深刻指出,湘江战役是红军长征的壮烈一战,是决定中国革命生死存亡的重要历史事件。在湘江战役中,处处闪耀着中国共产党人理想信念的光芒,无数先烈用顽强的斗争和不屈的意志证明:艰难可以摧残人的肉体,死亡可以夺走人的生命,但没有任何力量能够动摇中国共产党人的理想信念。在生死存亡的历史关头彰显铁的纪律  1934年11月,中央红军在连续突破国民党三道封锁线后,在湘江边
在中国制造2025的影响下,工业机器人和智能化产品的发展也越来越迅速。机器人作为新时代的重要发展领域,也是现在社会上流水线上常用的机械设备。目前很多危险、高强度的工作
分布式光纤传感技术在大型设施健康安全监测领域有着越来越多的应用,其中φ-OTDR技术依靠其对振动信号的实时感知和处理能力,适合作为需要特性如长距离,大范围,实时性的设施