基于排序学习和卷积神经网络的推荐算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:genersoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术特别是以淘宝和亚马逊等为代表的电子商务的飞速发展,互联网中的数据呈现爆炸性增长,信息过载问题显得越来越严重。帮助我们从海量数据中筛选出有意义数据的信息过滤技术显得越来越重要。在此背景下,推荐系统诞生了,并且迅速发展成为当前互联网应用中的重要组成部分。推荐系统根据用户行为记录从大规模数据中找到用户感兴趣商品,它对于提高用户的满意度和零售商的销售额具有重要的意义。用户在互联网中的行为主要分为两类,分别是隐性反馈行为和显性反馈行为。其中在隐性反馈行为中用户没有显式地表达对特定商品的偏好,主要包括用户的点击、浏览、收藏等行为;而在显性反馈行为中用户则显式地表达了对特定商品的偏好信息,这些行为中较为常见的主要有评分行为。针对不同类型的用户反馈行为数据有不同的推荐方法,本文对两种不同的用户反馈行为进行了细致地分析和挖掘,并且分别有针对性地提出了两种方法以提高推荐系统的性能。针对显性反馈行为的评分行为,本文选取Top-K推荐作为研究目标。引入信息检索领域排序学习的方法并且融合用户的社交信息和商品标签信息,本文扩展了一种基于列表排序学习的矩阵分解方法,一方面充分考虑用户之间关注关系。首先通过用户之间的关注关系计算用户之间的信任度,接着通过用户之间的信任度在原始模型的损失函数中添加用户社交约束项,使相互信任的用户偏好向量尽可能接近。另一方面,计算商品所拥有标签的权重并以此计算商品之间的标签相似度,再将商品的标签约束项添加至损失函数中。在真实Epinions和百度电影数据集中的实验结果表明,我们提出的方法的NDCG值和原始模型相比具有一定的提高,有效地提高了推荐准确率。针对隐性反馈行为,本文选取电子商务领域的下一个购物篮推荐作为研究目标。本文首先将用户行为按照一定的时间窗口进行划分,对于每个窗口从多个不同的维度抽取用户对商品的时序偏好特征;接着运用深度学习领域的卷积神经网络模型,模型中的卷积层组合不同长度的特征图来训练分类器。在阿里巴巴移动推荐算法竞赛公布的真实数据集中的实验结果表明,和传统的线性模型和树模型等分类器相比,我们提出的卷积神经网络框架具有较强的特征萃取能力和泛化能力,提高了推荐系统的用户满意度。
其他文献
随着全球信息资源的数字化进程日益加快,以及电子商务、电子政务的日趋流行,对网上发行的电子刊物进行盗版追踪,对来往的电子信函、公文或传真进行完整性认证变得曰益紧迫。
工作流技术可以有效地优化企业的业务流程,提高企业业务流程的灵活性。但是传统的工作流技术却不能将不同的系统进行有效地集成,或者使业务流程集成的实现非常复杂。而面向服
多机器人系统是目前机器人研究领域的热点问题,是机器人学、控制理论、计算机技术、通信技术、电子技术和人工智能等多个技术学科交叉的产物。在多机器人相关技术的研究中,路
随着计算机技术、无线通信技术和微电子技术的发展和成熟,无线传感器网络逐渐成为收集和处理海量数据的重要途径。在无线传感器网络中,大量部署在特定区域内的集感知、计算和
电子邮件自从产生以来,就给人们的工作生活带来了极大的方便,然而随之而来的垃圾邮件问题也越来越严重。垃圾邮件不仅占用大量的网络资源,同时也严重危害着人们的利益,给人们
人脸三维模型编辑是人脸造型重要手段之一。设计者通常采用手工作业将已有人脸模型编辑成理想人脸形状。但是,这种编辑模式并不适用于面向普通用户。对于普通用户来说,最简单有
随着计算机网络的迅速发展,计算机网络已经渗透到了社会的各个方面。在人们的日常生活中,计算机网络也变得越来越重要。近年来,由于网络规模的不断扩大和复杂性的不断增加,如
在目前医学及生命科学研究中,基因芯片被广泛用来进行各种生物实验。其中寻找差异基因在芯片实验中是最基本的实验目的,它在基因诊断、药物筛选等方面有着重要作用。由于芯片
虚拟化技术是一种在工业界以及学术界快速成长的技术。虚拟化技术包括软件虚拟化以及硬件虚拟化技术。其给计算资源的共享与管理带来很多的便利之处。虚拟化技术作为”云计算
随着计算机科学的不断发展,计算机软件的应用范围日趋广泛,规模迅速扩大,复杂性不断增加,人们对其可靠性的要求也越来越高。软件可靠性模型研究作为软件可靠性估测的核心问题