基于深度学习的推荐算法研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:lhmsgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络和移动互联网的快速发展,电子商务和基于位置的社交网络(LBSN)也得到了迅猛的发展,如亚马逊,阿里巴巴,京东,Facebook,Foursquare,Gowalla等,同时,信息过载问题也日益严重,如何从海量的数据中挖掘出对用户有价值的信息,降低信息冗余,成为了工业界和研究界的热点问题。而这也是推荐系统所要解决的问题。推荐系统主要面临着如下的问题一数据稀疏性,由于用户和项目之间的交互数据很少,导致用户项目交互矩阵过于稀疏,使得推荐系统无法利用用户的稀疏历史记录做出准确的推荐。然后就是冷启动问题。对于没有历史记录的新用户,推荐系统自然也就无法利用其历史记录做出推荐。冷启动问题可以看成数据稀疏性的极端。由于在现实世界中,用户和项目有丰富的上下文信息,例如用户的社交关系,工作,年龄,项目的地理位置,标签,属性,价格等,越来越多的人开始使用这些附属信息来缓解这两个问题。同时由于这些上下文信息属于异构数据,如何融合这些异构的上下文信息也成为一个重大的挑战。另一方面,不同的用户有不同的签到分布,现有的基于位置的POI推荐算法未能够充分利用用户的签到分布特征和区域特征。传统的推荐算法主要是利用用户的历史交互数据进行建模,例如矩阵分解算法,最经典的推荐算法之一。利用用户向量和项目向量的点积来预测概率的大小。然而这种利用简单的线性关系进行建模,并不能反映现实世界中复杂的非线性关系。随着深度学习在自然语言处理,图像处理,语音识别等领域的巨大成功,越来越多的人将深度学习应用到推荐系统当中。本文也将使用深度学习技术来解决。针对上述问题以及为了向用户提供更好的推荐服务,本文主要从以下三个方面进行研究:(1)基于自注意力机制的推荐算法。本文提出了一种新的基于自注意力机制的模型(SATCo NN)来融合用户相似度和项目相似度。SATCo NN通过RNN来提取用户历史序列特征,使用自注意力机制从不同语义获取用户购买历史中各个项目的权重。并借鉴了风格迁移的思想,本文使用Gram矩阵来建模用户的购物风格,我们使用Maxpooling技术来提取用户购物风格。(2)基于一阶协同过滤树的推荐算法。本文提出了一种无监督的用户签到分布特征提取器,即CD-Ex,它能够无监督的学习用户签到分布特征,本文也提出了基于用户的协同过滤树和基于项目的协同过滤树,借用消息传递的思想来学习用户和项目的深层次表示。在这两个模块当中,本文使用多头注意力和原始注意力机制来学习用户和项目的表示,关于用户社交关系,本文在基于用户的协同过滤树中使用用户的朋友来分配权重并聚合得到用户朋友的表示。(3)基于多粒度区域感知的推荐算法。本文通过对用户签到地区进行网格划分,并通过各个区域内签到概率的统计得到了三种不同粒度的签到分布矩阵即用户签到分布矩阵,朋友圈签到分布矩阵,和区域热度矩阵,并将这三种矩阵进行加权求和并通过卷积神经网络得到用户的签到分布向量,本文还提出了四个模块,用户偏好模块,签到分布模块,项目热度模块,区域间接模块,项目热度模块可以很好的缓解冷启动问题。
其他文献
近年来,上海总和生育率继续处于超低水平,并没有因为全面两孩政策的放开而有所提升。学界在预测未来生育水平时多数将原因归为育龄妇女生育意愿不高。但实际上,除了生育意愿外,婚育模式的改变对生育力也有一定的影响。在新的形势下,对当前上海市育龄妇女的婚育模式变动进行研究具有重要的理论和现实意义。本文基于上海市育龄妇女婚育模式的变化,对当前上海市育龄妇女人数、生育的状况进行描述性统计分析,并在预测目标年份年龄
习近平总书记曾多次强调青年一代思想政治工作的重要性,要切实加强青年群体思想政治引领,引导青年人形成正确的人生观、世界观、价值观,让青年一代做好社会主义的建设者和接班人。新时代大学生作为青年群体的主力军,其政治意识的状况不仅关乎自身的成才立业,关乎高校铸魂育人工作的顺利实施,还关乎我国国家意识形态安全,甚至关系到中华民族伟大复兴中国梦的实现。因此,有必要深入研究新时代大学政治意识的形成和发展并对其政
时代进步的步伐从未停止,企业在时代发展中面临的不确定性因素越来越多,风险与日俱增。2017年9月6日,COSO委员会发布了更新后的全面风险管理框架COSO-ERM(2017),新的框架从整合风险管理的视角作为切入点,深度探讨了如何提升企业创造价值的能力,并最终保障战略目标的实现,以应对新环境下的新挑战。全面风险管理作为现代管理理论中的重要组成部分之一,是完善国有资产管理体制的重要一环,也是保障国有
当前由于科学技术和工业生产的飞速发展,工业或者生活废水排入到水体环境中会造成污染,环境污染问题形势愈发严峻,其中含酚废水为难降解有机污染物。而对于传统的水处理方法
在水利行业中,水库水位及其预警等级是水库安全运行管理的关键信息,也是水库水灾漫坝预防的关键信息。随着人力成本的增加,传统方法水位传感器维护困难;基于云端计算的水位预警识别,存在图像视频数据储存压力大、数据传输带宽费用成本高等问题。因此在嵌入式边缘计算终端使用计算机视觉进行语义分割水位预警识别,对降低水库安全管理成本和提高水利工程智能识别普及度有着非常重要的意义。图像语义分割是计算机视觉领域重要研究
氢能燃料电池(简称氢能电池)以其高效、稳定、响应快速、噪音低、零排放等优势,拥有着广泛的发展应用前景。然而因其使用寿命短、成本高、电池老化后故障难以诊断等因素,使氢能电池商业化面临重重阻碍。因此,通过对氢能电池寿命预测、故障诊断等工作,及时了解氢能电池健康状况,诊断氢能电池故障,对推动氢能电池商业化发展具有重要的意义。本文旨在设计和实现氢能电池的数据分析平台。首先,在明确设计实现氢能电池数据分析平
网上诈骗、网络攻击等互联网安全问题日益突出,在网上交易和共享资源的互联网用户随时随刻都有可能受到信任攻击。因此,模拟信任攻击场景,预测攻击者的攻击行为是十分必要的
维度约减旨在尽可能不丢失信息的前提下,将高维数据映射到低维空间,它是高维数据分析中的重要方法,随着科技的发展,包含丰富信息的高维数据呈爆发式增长。随着数据维数的增加,如何从高维数据中提取有效信息成为了诸多领域需要解决的关键问题,如机器学习、文本分析、图像处理等。本文研究了部分经典的维度约减技术,并在基于神经网络的维度约减方案上提出了改进,引入了残差结构、鉴别网络和对抗式训练思想,并实现了数据获取系
“外协件生产准备”是汽车企业新车型开发的非常重要的环节之一,它是指汽车企业将外购件发包给零部件供应商后,零部件供应商按照同汽车企业之间的合同约定,进行工装的制造、零部件质量提升、设备的采购、人员的培训和零部件生产供货,以保证供货级总成达到批量生产的各项要求。其中,白车身外协件是所有外协件中最为特殊又十分重要的一系列产品。因此,如何做好“白车身外协件生产准备”是所有主机厂必须思考和不得不面对的核心课
随着社会在不断的进步,世界的信息技术在快速发展,人们的消费观念在逐渐转变,中国电子商务事业也得到了飞速的发展。网上购物就变成了人们生活的新潮流和新趋势,以至于跨境电