基于用户行为序列挖掘的个性化推荐方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：morpheus

【摘要】

：

【作者】

：

刘丰

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2021年01期

【关键词】

：

推荐系统用户行为序列序列推荐强化学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

推荐系统是数据挖掘和机器学习领域热门的研究方向之一。在互联网技术飞速发展的大数据时代,推荐系统是解决信息过载的重要技术手段。推荐系统的性能取决于推荐模型或算法对于用户个性化的兴趣和需求的理解。如何利用合理的技术手段,从大规模高维稀疏的用户历史行为数据中,挖掘出用户个性化的兴趣与需求,是当下推荐系统领域的重点研究问题。用户历史行为数据天然以序列（会话）的形式累积在推荐系统中。传统的推荐方法大多采用基于单个样本（Point-wise）的排序推荐框架,独立地预估每个待推荐项目（Item）的排序分数,忽略了近邻项目之间的序列相关性。特别是对于用户喜欢的某一类项目,传统的方法倾向于将相似的项目排到推荐列表前面,造成了推荐内容的同质化。长期如此,传统的方法会影响用户的个性化体验。因此,为了解决上述问题,本文从用户行为序列建模的角度,来挖掘用户历史行为数据中隐藏的个性化偏好信息。一方面,由于用户的个性化偏好会随着时间动态的变化,本文中的这种建模方式可以有效地挖掘出用户实时的兴趣偏好信息,对于提高推荐系统的实时性和精确性有重要作用。另一方面,本文在挖掘用户行为偏好时,提出合理的技术手段来探索用户其它的兴趣需求。该建模方法对于提高推荐系统的长期收益有重要的意义,并且能在一定程度上缓解推荐内容同质化的问题。现将本文的主要研究内容总结如下:（1）针对现有基于用户响应预测的推荐方法中对于特征交互的重要性建模不准确的问题,提出一种基于多尺度注意力机制的因子分解机推荐模型（Dual attentional factorization machine,简称DFM）。DFM中的多尺度注意力网络可以较好地学习组合特征之间的权重关系,对于用户行为偏好的建模较为准确。在对比试验中,DFM取得了较好的实验精度,验证了DFM的有效性。在消融实验中,通过增删不同注意力机制组件,来验证DFM中的注意力网络对于组合特征重要性建模的有效性。另外,本文通过可视化组合特征权重的方法,对实验结果进行可解释性分析。该解释性说明验证了DFM中的注意力网络可以有效学习组合特征的权重,从而提高推荐模型的性能。（2）针对现有序列推荐模型中对于序列依赖性建模不完善的问题,提出了一种基于序列间项目相关性挖掘的个性化序列推荐框架（Inter-sequence enhanced framework for personalized sequential recommendation,简称ISSR）。现有的序列推荐方法注重于对单一序列进行建模,这种建模方式会损失序列间的项目依赖信息。因此,ISSR提出从整体出发,利用图神经网络来对序列间项目相关性（Item correlation）进行建模。并且,ISSR利用循环神经网络对序列内部项目相关性进行建模,然后通过前融合方式来生成最终的用户兴趣表示。最后,利用该兴趣表示来计算待推荐项目的排序得分,从而完成推荐任务。对比实验在四个不同规模、不同稀疏度的数据集上展开。分别对比了经典的序列推荐模型和当下基于深度学习的模型。其中,ISSR取得了较好的实验精度,验证了其有效性。消融实验从两个维度展开:通过将ISSR中用于建模序列间项目相关性模块的图神经网络换成低阶的矩阵分解模型,用来验证图神经网络的作用;以及将ISSR中序列间相关性模块增加到现有的只对序列内部项目相关性建模的对比模型中,用来验证该序列间项目相关性模块的作用。消融实验结果均验证了ISSR中序列间项目相关性模块对于序列推荐模型的重要作用。（3）针对现有基于监督学习的推荐模型无法对推荐系统长期收益建模的问题,提出了一种基于深度强化学习的个性化推荐框架（Deep reinforcement learning based recommendation,简称DRR）。其中,DRR是基于Actor-Critic强化学习框架。Actor部分用来学习推荐策略,Critic部分对当前推荐策略进行评估并优化。相比于其他基于强化学习的推荐方法聚焦在策略的构建和优化上,本文在DRR中重点探索了合适推荐场景的用户状态表示建模方法。在对比实验中,本文分别和传统的监督学习方法（包含矩阵分解方法和深度学习方法）、基于多臂摇臂机（Multi-armed bandit,简称MAB）的推荐方法、以及现有的基于强化学习的推荐方法分别进行了对比,实验结果验证了DRR推荐框架的有效性。另外,在DRR框架中,本文对不同的用户状态表示建模方法进行了对比。实验结果也表明了针对推荐场景构建的用户状态表示模块相比更一般的神经网络的效果更好。（4）针对基于强化学习的推荐模型头部位置推荐效果不理想的问题,提出了一种融合了监督学习和强化学习的混合个性化推荐框架（Supervised reinforcement learning based recommendation,简称SRR）。SRR中引入了一个监督学习模块,其作用是约束当前的推荐策略,防止其偏离用户历史行为偏好较远。因此,本文提出融合监督学习和强化学习的推荐方法,可以在探索用户长期兴趣的同时,提高推荐结果的准确性,尤其是推荐列表的头部位置。实验在多个数据集上展开,分别对基于策略和基于价值的强化学习推荐模型进行了对比。实验结果表明,融合了SRR推荐框架的推荐模型其推荐列表头部位置的精度得到较大的提升。并且,推荐模型的长期收益,如平均奖励等并未出现较大的损失。另外,在案例分析中,本文通过实例化用户的推荐列表的方式,验证了融合SRR框架的模型,其头部位置的推荐精度得到了提升。（5）针对基于强化学习的推荐模型存在训练不稳定的问题,提出了一种能端到端稳定训练的强化学习个性化推荐框架（End-to-end deep reinforcement learning based recommendation,简称EDRR）。本文首先将基于强化学习的推荐模型总结到一个统一的推荐框架中。该框架由嵌入向量模块,用户状态表示模块和推荐策略模块自底向上组成。其中,大多数的工作使用一种‘‘预训练并固定’’的嵌入向量模块。本文详细分析了采取该设定的原因以及可能存在的问题。为了进一步提高模型的推荐效果,本文提出了一个能端到端稳定学习的强化学习推荐框架EDRR。EDRR中引入了一个监督学习模块,其产生的监督学习信号和强化学习信号共同指导模型的更新方向。本文分别将基于策略和基于价值的强化学习推荐模型融入到EDRR框架中,在不同的数据集上展开对比实验。实验结果表明,融合了EDRR框架的强化学习推荐模型可以实现稳定地端到端训练,并且模型的精度也取得了进一步的提升。

其他文献

稀土基荧光强度比测温方法的相对灵敏度及抗干扰研究

快速、准确、无接触式的温度测量在许多领域都具有十分重要的地位。在众多的测温方法中,荧光强度比测温方法因其非接触的工作模式、较强的抗干扰、优异的空间分辨率、快速的时间响应、相对廉价的探测装置等特点而极具应用潜力。然而该荧光测温方法还存在相对灵敏度较低等问题没有解决,本论文致力于解决这些基础物理问题,研究稀土基荧光强度比测温方法的相对灵敏度及抗干扰特性。研究了玻尔兹曼分布适用的热耦合能级的间隔上限。研

学位

荧光强度比测温稀土元素相对灵敏度抗干扰

高性能钴基负极材料的设计制备及储锂/储钠性能研究

锂离子电池因具有工作电压高、能量密度大、循环寿命长等优点,被广泛应用于各种电子设备。然而,由于商业化石墨负极理论容量的限制,锂离子电池的能量密度已经达到它的上限。相比于锂离子电池,钠离子电池具有资源丰富、价格低廉等优点,在大规模储能领域具有更大的成本优势。但钠电负极材料的研究也处于与锂电相同的困境。因此,开发一种高效的负极材料以解决锂电和钠电的困境就成为了目前研究的重点。钴基化合物作为一种典型的转

学位

锂离子电池钠离子电池负极材料四氧化三钴二硒化钴

复杂非线性系统的自适应容错控制研究

随着控制系统的发展,其可靠性和安全性也越来越受到人们的重视。然而由于系统结构变得越来越复杂且系统规模越来越庞大,系统的执行器和传感器等元部件不可避免会发生故障,从而导致系统控制性能下降,甚至导致系统运行不稳定。因此,如何针对具有执行器和传感器故障的非线性系统设计有效的容错控制器,保证系统的稳定运行具有重要的理论意义与实际应用价值。本文基于自适应反步控制方法、模糊逻辑系统、容错控制方法、非线性和随机

学位

非线性系统随机系统执行器故障传感器故障容错控制模糊控制

阿什河流域土地利用/覆盖变化的水文响应及可持续利用

随着城市化进程的发展,人类活动导致阿什河流域的土地利用和土地覆盖（LULC）发生了巨大的变化。这种土地利用/土地覆盖变化显著改变地表径流,作用于流域生态水文过程,并对河流水质产生影响。基于此,本研究调查了阿什河流域土地利用/土地覆盖变化对流域生态水文过程的影响,以及如何应用可持续土地利用管理（SLM）技术解决流域污染问题。本文利用卫星图像提取并分析了从1990年到2014年阿什河流域的LULC时空

学位

土地利用/土地覆盖变化马尔可夫模型SWAT模型强度分析土地可持续利用管理水文响应

Si2N2O基陶瓷的水基直写成型工艺与性能研究

Si2N2O陶瓷化学性质稳定,介电和力学性能优异,在航天透波领域极具应用潜力。但Si2N2O固有的硬脆特性使得复杂构型部件的制备效率低下且成本高昂,限制了其进一步发展。直写成型技术（DIW）能够以陶瓷浆料为墨水,高效成型复杂构型的陶瓷坯体,缩短产品设计-制造-测试-应用周期。本文开展了Si2N2O陶瓷的DIW成型工艺及性能研究。包括高性能水基墨水的设计和优化,水基浆料流变特性的演变规律;原料组成对

学位

Si<sub>2</sub>N<sub>2</sub>O陶瓷直写成型技术流变性能β-Si<sub&g

MAPbI3和MAPbBr3钙钛矿晶体的电子束辐照稳定性及分解机理

近年来由于合成价格低廉以及光电转化效率高,基于有机无机杂化钙钛矿（Organic-inorganic hybrid perovskites,OIHPs）材料为光电转换层的太阳能电池得到了飞速发展。然而OIHPs材料结构不稳定,容易分解,进而影响太阳能电池器件的效率和稳定性,极大地阻碍了该技术的商业化发展。研究其分解机理有利于指导器件性能优化。在众多研究手段中,透射电子显微镜（Transmissio

学位

有机无机杂化钙钛矿透射电子显微镜分解机理中间相抑制分解低剂量成像

低环境温度准二级变频空气源热泵供暖性能提升研究

近年来,随着我国“煤改清洁能源”的推进,准二级压缩空气源热泵在华北等寒冷地区得到了快速应用,取得了良好的节能效果,也促进了空气源热泵从采用定频压缩机到变频压缩机的普及,即准二级变频空气源热泵。然而,当准二级变频空气源热泵应用到温度更低的严寒地区时,因环境温度更低和负荷调节变化而遇到低温适应性、结霜区间变化和除霜速度慢等问题,影响其供暖性能。本文以推动准二级变频空气源热泵在严寒地区的应用为主要目标,

学位

空气源热泵准二级压缩性能提升低温适应性结霜图谱补气除霜

纳米材料对顶管法施工触变泥浆减阻性能影响及浓度优选研究

顶管法施工具有设备少、工序简单、工期短、造价低等优点,被广泛应用于城市涵管、管廊等工程中。触变泥浆是顶管施工中重要的润滑减阻剂,其减阻性能的好坏对顶管施工特别是长距离、大断面顶管工程的顺利进行至关重要。论文使用膨润土触变泥浆为基础泥浆,质量配比为膨润土:羧甲基纤维素钠（CMC）:无水Na2CO3:水=80:2:3:920,并选择纳米ZnO、纳米SO2、纳米Al2O3 3种纳米材料作为添加剂,通过测

会议

触变泥浆顶管施工减阻性能纳米材料

Ga2O3纳米棒的制备及紫外探测性能研究

日盲紫外探测技术凭借其环境噪声低、抗干扰能力强、灵敏度高等优势获得了越来越多的关注,并在短波通信、导弹预警、火灾检测、生物医疗、天文天体等多种领域都具备实际的应用价值。Ga2O3作为半导体材料,禁带宽度范围在4.4～5.3e V,对应的响应波段正好位于日盲紫外区域,同时它具有制备手段丰富、稳定性高等多种优势,自然推动其成为了日盲紫外探测领域的热门候选材料。然而Ga2O3也存在一些问题,包括制造高质

学位

氧化镓日盲紫外探测纳米结构异质结水热

碳纳米管调控的镍钴MOF基电极材料及其储能性能研究

日益增长的能源储存需求对电化学储能器件的要求越来越高,合理设计和构筑新型电极材料以提升储能器件的性能已成为当前新能源发展战略下的重要课题,也是推动社会经济可持续发展的重要保障。作为一种极具前景的电化学储能器件,混合超级电容器有机结合了电池和超级电容器各自的储能优势,实现了高能量储存和高功率输出的一体化。电池型电极作为混合超级电容器的重要组成部分,对整个器件的储能性能具有决定性的影响。因此,合理设计

学位

混合超级电容器碳纳米管金属有机框架电池型电极氧化还原反应

基于用户行为序列挖掘的个性化推荐方法研究

与本文相关的学术论文