基于序列数据和会话数据的个性化推荐研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户：bvhd5467h

【摘要】

：

【作者】

：

盛真真

【机构】

：

上海财经大学

【出处】

：

上海财经大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大数据时代的到来,给我们的工作和生活带来了诸多的便利,也带来了“信息过载”问题。为了解决互联网大环境中日益严重的“信息过载”问题,个性化推荐技术受到了学术界和工业界的广泛关注。个性化推荐的基础是用户的交互数据,核心是用户动态偏好的表征。围绕这个核心,基于个性化推荐中最受关注的序列数据和会话数据,本文提出了三个具体的研究问题。（1）基于序列数据构建推荐模型时,如何更准确地表征用户的交互意图和动态偏好?（2）基于会话数据构建推荐模型时,如何将用户的交互序列准确地转换成用户真实的交互模式?（3）如何准确地识别交互会话中用户不同的交互目的?现有的序列推荐模型大都以循环神经网络为主体,并采用统一的建模框架:以单个交互行为作为输入单元,对用户的交互意图进行建模,将循环神经网络的最后一个隐状态作为用户的动态偏好表征,生成推荐结果。实际上,用户的交互意图往往是由多个交互项以会话的形式共同表征的。因此,如何构建更合理的输入单元使其可以更好地表征用户的交互意图是促进推荐的一个重要因素。此外,仅使用循环神经网络的最后隐状态来捕捉用户偏好是不够的,因为循环神经网络的存储单元很难保留全局序列模式。因此,如何有效保留全局序列模式以促进用户动态偏好表征是增强推荐效果的另一个重要因素。针对以上问题,本文提出了一种新的分层的基于时间的定向注意力（HTDA）网络框架,该框架包括用户意图表征层和用户动态偏好表征层。具体来说,为了解决交互序列与用户真实交互意图之间的匹配偏差,本文提出了一种细粒度的用户意图表征方法。首先,通过引入时间阈值,对用户的原始的交互记录进行划分,以获得粗粒度的用户意图表征。然后,通过在粗粒度的用户意图表征上应用多维自注意力机制,以捕获交互项的交互特征之间的转换模式,进而获得细粒度的用户意图表征。为了捕捉交互的全局序列性,本文构建了一种新的基于时间的定向注意力机制。它通过引入时间因子使得注意力机制可以感知交互项的时间属性,通过引入掩码矩阵使得注意力机制可以捕捉输入单元之间的方向性。实验分析论证了本文提出的HTDA框架的有效性。相较于序列推荐,会话推荐中无法直接获取匿名用户的历史交互记录,交互数据更加稀疏,因此其对模型准确捕捉用户偏好的能力要求更高。现有的会话推荐模型大都是在如下的基本假设下进行构建的,即,交互会话中用户的交互项之间的序列关系与用户真实的交互模式之间是一一对应的,也就是说会话中相邻交互项之间的前后顺序关系是严格的不可逆的。实际上,会话中交互项之间严格的顺序关系并不能完全等价于用户真实的交互模式。因为会话中用户真实的交互模式并不是只有序列模式,往往还存在共现模式,是多种模式的交替存在。共现模式是指两个交互项总是成对出现在交互列表中,但两者之间并不存在明显的顺序关系。因此,如何将会话中交互项之间的序列关系准确地转换为用户真实的交互模式,将有助于以此为基础拓展推荐模型,并进一步增强推荐效果。针对以上问题,本文提出了一个增强的图神经网络（E-GNN）用于会话推荐。在E-GNN中,本文关注的是如何基于会话中交互项之间的序列关系识别用户真实的交互模式。为了识别会话中用户真实的交互模式,E-GNN综合考虑了所有用户的全局交互行为和目标用户在当前会话中的交互行为。具体来说,为了显式地建模当前会话中各种交互模式之间的耦合关系,本文首先基于所有用户的历史交互会话构造了一个加权全局项目图（WGIG）。WGIG中任意两个相邻节点之间的有向边的权重都由同一方向上的边的数量与两个节点之间所有边数之和的比率确定。WGIG中的权重值代表其对应的交互项之间的序列性和共现性的强弱,权重值越接近1代表序列性越强,越接近0.5代表共现性越强。然后基于当前会话中交互项之间的序列关系构造局部会话图（LSG）。LSG中每个节点代表会话中一个非重复出现的交互项,节点之间的有向边与会话中交互项之间的顺序关系相对应。最后利用本文提出的融合算法将LSG与WGIG中对应边的权重值进行整合,以获得代表用户真实交互模式的增强图E-GNN。该E-GNN通过门控循环单元学习图中各节点的表征向量,并利用注意力机制生成整个会话图的表征。实验分析论证了本文提出的E-GNN框架的有效性。会话推荐中如何根据有限的交互记录更加准确地捕捉用户当前的偏好一直是研究热点。前文已经探究了会话中用户交互序列与实际的交互模式之间的转换关系,并提出了一个新的基于图神经网络的框架。除了上述提到的用户交互模式的识别问题,交互会话中用户的交互目的识别也是一个非常重要的研究问题。会话中用户交互目的的识别会直接影响后续会话整体表征与用户真实偏好之间的距离。现有会话推荐通常利用注意力机制聚合会话中各交互项的表征向量以生成会话的整体表征,并以此代表用户偏好。以上研究范式的一个基本假设为一个会话中所有交互项都代表相同或相近的用户交互目的。实际上,一个会话中用户的交互目的往往是多样的,并且之间通常存在较大的差异。因此,如何准确地识别用户在会话中的交互目的以增强会话整体表征是增强会话推荐的一个重要因素。针对以上问题,本文提出了一个新的目的感知会话推荐模型（PASR）。在PASR框架中,首先基于用户当前交互序列构建交互会话图,以此来捕捉相邻交互项之间丰富的关联信息,从而获得具有强表达力的交互项表征向量。根据交互项之间的相似度,提出了一种交互目的识别算法（IPRA）,对原始的用户交互会话进行划分,所得子会话分别代表用户不同的交互目的。然后,针对不同的交互子会话分别生成代表用户不同交互目的的表征向量。最后,利用线性变换将用户目的表征向量、短期偏好表征向量和长期偏好表征向量映射到统一的向量空间,并与候选集中的项目表征进行匹配以获得最终的推荐列表。实验分析论证了本文提出的PASR框架的有效性。

其他文献

资源产业依赖对幼童死亡率的影响：理论与中国县域经验证据

一直以来,学界就资源产业依赖对经济增长的“诅咒”效应开展了诸多讨论,但对于资源开发活动对居民（尤其是幼童）所产生的“健康诅咒”效应却鲜有关注。无疑,就资源产业依赖如何影响居民健康开展专门考察,有助于减缓甚至避免这一健康诅咒效应,从而保障健康人力资本对经济长期可持续增长推动作用的有效实现。资源产业依赖对经济增长的“资源诅咒”效应及其产生的空气污染、高碳排放是造成资源型地区儿童健康损害和未来健康不确定

学位

中国宏观杠杆的演变逻辑与调控策略分析——基于全球债务结构变化、宏观杠杆国际联动以及货币政策调控的研究

当今世界正经历百年未有之大变局,从经济上讲,随着世界经济重心向亚太地区转移,作为全球人口最多的国家、第二大经济体以及最大的贸易国之一,中国无疑是这场全球性经济变革的中心,并即将主导世界经济的发展。尤其是在此次全球性新冠肺炎疫情爆发之际,中国取得了全世界最早控制本国疫情蔓延、最慷慨援助各国抗疫、唯一实现经济增长的突出成绩。因此,中国的发展对稳定世界经济增长和提升全人类福祉发挥了不可替代的作用。但是,

学位

性别视角下的创业企业早期融资绩效研究——基于实验设计和加速器的路演数据

近年来,女性创业者迅速崛起,她们已经成为助力高质量发展的经济和科技创新“新引擎”。然而,相较于男性创业者,女性创业者仍面临更大融资缺口和融资困境。这给企业自身、投资人以及政策制定者都带来了新挑战。具体而言,融资中的性别差距不仅阻碍了女性创业企业的快速成长,也限制了投资人的投资回报率。此外,党和政府高度重视经济发展中的“她”力量,始终为女性创业提供强有力的政治保障和制度机制保障。因此,探寻融资中存在

学位

智能化手机支架设计

智能化手机支架是结合市场上智能化支架的优缺点，加以创新。首先，可以通过红外测距提醒用户距离过近；其次，为电子产品充电；最后，利用光源感应器和热释电红外传感器等，达到照明和语音识别的功能，缓解眼睛疲劳，减少颈椎和眼睛的压力。该支架市场上的技术应用简捷，性价比高，市场潜力很大，具有很好的发展前景。

期刊

交易信息、资产价格与渐进有效市场假说

自“有效市场假说”概念提出以来,价格与信息,已成为金融学术研究重要话题,同时,亦是市场实践重点关注对象。围绕着“有效市场假说”,学术研究中理论研究就市场价格反映基本面信息、市场聚集汇总信息的方式、机制等,有效市场的可能性,及市场其它形式等多个方面展开热烈讨论。而实证研究方面,大量实证研究工作实证检验市场有效性,围绕市场有效性的争论更是持续至今,支持市场有效的实证证据与反对市场有效的“金融异象”层出

学位

产品众筹最优策略研究

近年来,随着产品众筹的发展和成熟,越来越多的新兴企业解决了融资难的问题,产品众筹快速发展的过程中也出现一些挑战。尤其2020年面对新冠肺炎疫情的威胁,全球经济受到严重阻碍,众筹行业也经历了艰难时期。据统计,2020年众筹行业的交易额统计达到9.4亿美元,仅为2019年全球交易量的13.6%。美国的众筹交易额在全球最大,据数据统计美国2020年的交易额达到4.38亿美元,约占全年交易额的一半,然而项

学位

税收制度改革对上市公司投资结构“脱虚回实”的影响——“营改增”的视角

改革开放40多年来,中国经济增速迅猛、总量急剧扩张,2010年GDP首次超过日本,一跃成为世界第二大经济体。在快速发展的同时,中国经济同样面临艰难挑战,尤其在2008年全球金融危机后,大规模刺激政策给中国经济留下诸多“后遗症”。其中宽松的货币政策释放大量流动性,造成了虚拟经济爆发式增长,而实体经济却面临成本上升、利润下滑、投资增速疲软等难题,导致宏观经济结构失衡的局面日益严峻,并逐渐成为阻碍中国经

学位

日本房屋租赁的法政策学研究

房屋是现代社会重要的生活生产资料,也是市场经济体制下重要的投资工具。社会经济的不断发展和城市化进程的加速导致房价不断高涨的现实,房屋租赁作为保障国民基本住房问题的手段越发凸显出其重要性,而对房产市场进行法律规制也是各国的普遍做法。自十九大报告提出加快建立多主体供给、多渠道保障、租购并举的住房制度以来,我国正在逐渐构建和完善能够实现相应政策目标的法律体系,在目前的现状下,房屋租赁无疑是其中的重心所在

学位

机器学习算法辅助下的投资组合模型研究

现代投资组合理论是管理科学与工程领域的重要研究内容,随着软件和硬件技术的进步,投资组合理论已经发展成为算法设计、优化理论、机器学习、行为金融等多种学科的交叉点。从本质上而言,投资组合理论主要研究如何做出权衡风险和收益的最优投资决策。自1952年Markowitz提出均值-方差（MV）模型以来,数理工具被大量应用到投资决策中,进而推动诸多Quant公司的诞生。不仅如此,基于数理模型所开发出金融衍生产

学位

中国政府预算分类体系研究

政府预算分类体系是政府预算中的基础性制度设计,它定义了政府预算收支信息的组织和呈现方式,并且贯穿预算编制、审批、执行、报告的全过程。完善的预算分类体系对于保障政府及其部门合理获取和使用公共资金,充分履行公共受托责任,促进政府预算的规划、管理和控制功能的发挥,均不可或缺。中国自1999年以来,通过部门预算改革、政府收支分类改革等一系列预算改革,基本建立起了符合现代预算要求的政府预算分类体系框架。但是

学位

基于序列数据和会话数据的个性化推荐研究

与本文相关的学术论文