基于自编码器的神经协同过滤推荐算法研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:hgscmey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的不断发展,信息数据的总量与复杂度在飞速增加,信息过载已成为社会所面临的核心问题。推荐算法作为解决信息过载的重要方法,一直是学术界与工业界研究的焦点领域。传统的推荐算法大多是面向显式反馈而设计,由于隐式反馈数据的自身缺陷,面向隐式反馈的推荐算法效果并不理想。随着深度学习技术的愈加成熟,将神经网络与推荐算法相结合已成为推荐算法研究的热点。神经协同过滤模型是其中的代表性工作之一。该模型通过神经网络克服了隐式反馈数据的缺陷,得到了较好的推荐结果。然而神经协同过滤存在以下不足:在数据处理阶段模型生成的隐向量携带的有效信息较少,不能很好的代表用户与项目的本质属性;该模型使用参数量较多的多层感知机神经网络,模型收敛时间较长,不适合对时效性要求较高的推荐场景。1)针对神经协同过滤模型生成隐向量携带有效信息较少的问题,本文提出了基于变分自编码器的神经协同过滤模型,模型使用变分自编码器生成用户与项目的隐向量。相较于神经协同过滤简单的将用户与项目的ID数据通过独热编码生成隐向量的方式,变分自编码器使用用户历史行为记录生成稳定性的随机变量分布函数,有效地去除了隐式反馈数的数据噪音与数据冗余,根据此随机变量分布函数生成的隐向量能更好的代表用户与项目的本质属性。此外,该模型重新设计了神经网络结构,在网络底层融合了用户与项目之间的线性特征与非线性特征,使模型能更全面的提取用户与项目之间的潜在特征。基于变分自编码器的神经协同过滤模型相较于主流的推荐模型性能平均提升了2.5%。2)针对神经协同过滤模型收敛时间较长的问题,本文提出了基于降噪自编码器的卷积神经协同过滤模型。该模型使用结构较为简单的降噪自编码器快速生成用户与项目的隐向量。与神经协同过滤模型不同,此模型将用户与项目的隐向量进行二维嵌入生成特征交互图作为神经网络的输入。相较于向量连接等简单操作,特征交互图能携带更多的高维信息。模型使用卷积神经网络提取用户与项目的高维潜在特征。得益于卷积神经网络参数共享机制与强大的高维特征提取能力,基于降噪自编码器的卷积神经协同过滤模型相较于基于变分自编码器的神经协同过滤模型在模型收敛时间大幅减少的情况下性能有所提升。3)最后本文使用两个公开数据集将提出的两种模型和主流的面向隐式反馈的推荐算法进行了详细比较,验证了在准确率与归一化折损累计增益两种指标下模型的性能优势。并通过详细实验确定了两种模型的最佳负采样数的区间范围。
其他文献
铁路清筛机是一种定期更换铁路道床石砟的铁路养护设备,大型铁路清筛机造价昂贵,不适合用于某些短距离、有限时要求的铁路单开道岔路段道砟的清筛,为此,课题组前期初步设计了
"知识就是力量"是我们都熟悉的一句赞颂科学理性的格言,正是由于知识的力量,世界进入了蓬勃发展的工业时代.然而,我们现在又面临一个新的转型时期,知识逐渐取代工业时代占主
近年来,由于我国教育水平的不断发展,素质教育也不断被重视。传统的教学观念缺少对学生情感的培养,也没有意识到情感教育在教学过程中的重要作用,这在一定程度上阻碍了教学质量的
实施素质教育是迎接21世纪挑战,提高国民素质,培养跨世纪人才的战略举措。素质教育是为实现教育方针规定的目标,着眼于受教育者及社会长远发展的要求,以面向全体学生,全面提高学生
煤炭是世界公认的固体黄金,在我国社会生活中发挥着重要作用。随着现代化进程的加速,对煤矿的开发力度也越来越大。由于煤炭生产过程中不确定因素很多,非常容易引发安全事故。而
化学是以实验为基础的自然科学,离开实验,化学便会成为空中楼阁,虚无缥缈。实验是学生获取知识、创新知识的重要手段,也是培养学生学习兴趣和科学态度的重要途径。特别是对比实验
上海绿洲投资控股集团有限公司是一家以房地产开发为主业,集建筑施工及装潢、物业管理等综合性业务于一身的国家一级资质国有房地产开发企业集团。集团自成立起就秉承"以人为
职业中学数学教学是中学数学教学的一个重要组成部分。在教学时,首先,教师本人要端正教学态度,实施情感教育教学,充分调动学生的非智力因素,培养学生的自信心;其次,要教好职高班级学
水稻湿润育秧是手工插秧的配套育秧方法,该方法适应性强,操作方便,为江西省农民广泛采用。江西省一季晚稻播期在6月上旬,双季晚稻播期在6月下旬到7月上旬期间。俗话说"秧好一
期刊
古人云,吾道一以贯之,惟精惟细,持之以恒,假以时日,终成品质。3月11日,河北保定。卓正实业集团(以下简称"卓正")执行董事、总裁辛群来一身深色休闲装,坐在办公桌前批阅文件。许多