基于图神经网络的用户行为分析和个性化推荐

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:langjitianya198411
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前大数据的时代背景下,推荐系统已经开始在各种各样的场景下使用,尤其是在电商平台、新闻资讯、视频网站等场景。在视频推荐的应用场景下,本文对用户短期的交互行为数据、用户个人特征数据和视频特征数据进行分析,采用召回和排序两个阶段为每个用户生成一个个性化视频推荐列表。在召回阶段中,基于用户的交互行为数据构建以视频为节点的网络图,采用图神经网络中Node2Vec算法来提取视频的特征表示向量,进而得到视频-视频之间的相似度矩阵。结合用户-视频的交互矩阵进行协同过滤,为每个用户初步筛选得到一个大小为200的视频候选集。本文在传统协同过滤的基础上,引入时间衰减因子对用户-视频交互矩阵进行改进,来突出用户兴趣随时间变化的特点。通过实证对比分析发现,加入时间衰减因子后召回率为0.297124,这个指标相比于未改进的模型增加了1.4%,说明用户兴趣的变化是用户行为的分析中的一个重要因素。在实际业务中,可以对用户的兴趣区分长期兴趣、中期兴趣和短期兴趣进行分析。在排序阶段,基于用户特征数据和视频特征数据,以用户是否观看视频为目标训练排序模型,分别训练了逻辑回归、XGBoost、Light GBM和Deep FM模型,结果发现基于特征工程后训练的XGBoost模型效果优于推荐领域流行的Deep FM模型。本文采用模型融合的方法得到最终的排序模型,该融合后的模型相较于单一最优模型AUC指标提升了1.296%。在实际建模过程中,本文对用户特征和视频特征进行了特征工程,从用户角度构造了用户兴趣偏好、用户活跃度等特征,从视频特征角度构造了视频流行度以及对视频标签、导演和演员重要性等特征。通过XGBoost模型的特征重要性分析发现,基于用户兴趣画像构建的用户兴趣偏好特征是最重要的特征,说明本文构造的特征对于结果的预测是有必要的。最终,对召回阶段得到的候选视频集采用排序模型进行精准排序得到一个长度为30的个性化视频推荐列表,基于加入时间衰减因子后的召回模型和排序模型组合得到的召回率最高,达到0.235789。
其他文献
股票预测旨在预测股票的未来趋势,以帮助投资者做出良好的投资决策,利用统计模型预测股票已经成为股票市场的热点研究内容。股票价格波动不仅与自身状态相关,还与其他股票的状态变化存在密切联系,以往的股票预测研究中主要通过股票的行业关系或供应链关系学习股票间的相互影响,没有考虑股票价格波动呈现的相关性。本文通过股票收益率波动刻画股票价格波动,基于已有的通过图注意力网络联合股票行业关系学习股票间相互影响的股票
学位
在金融市场中,波动或波动性(fluctuation)是指金融资产在某段时间的变化,统计上一般以特定时间内标的资产价格涨落的标准差来衡量。波动率(volatility),作为金融市场中特有的名词,是指金融资产(包括股票、债券和利率等)价格波动的强弱程度。实际上波动率是不可观测的,只能基于标的资产的损益的标准差来估计资产在某个阶段的波动率。波动率的建模并解决风险管理和衍生品的定价始终是金融市场的热点及
学位
多因子选股是目前量化投资领域中最具代表性的策略模型,在国内外投资领域被广泛使用。多因子选股的核心是挖掘因子,任何与股票收益高度相关并且能够为预测股票收益带来帮助的量化指标都可以被称作因子。传统的因子挖掘大多集中在对于基本面数据的研究,此类因子通常有明确的经济含义,且预测周期较长,不过收益空间有限。近几年,以股票的价格、成交量、换手率等交易数据进行组合构建的短周期技术面因子开始受到量化研究者的关注。
学位
近几年,城市交通结构发生显著变化,私家车出行越来越普遍,导致在上下班高峰期交通发生严重堵塞,给居民出行带来严重不变。此外,大量的私家车出行会导致严重的空气污染,石油短缺,呼吸道疾病等,降低居民的生活水平。从2011年开始,我国正式启动公交都市建设计划,建立公交专用道,提高公交车运营效率,以便达到减少私家车出行的目的。但是,由于驾驶员法律意识和社会公德意识不强,造成公交专用道被占用,使得公交车出行带
学位
随着电商平台的涌现,电商触达的业务领域已经涵盖了大众消费的多个方面,也给消费者带来诸多便利。在阿里巴巴、京东等头部电商迅猛发展态势之下,消费者对电商模式接受度也越来越高,电商交易量呈现线性增涨。电商业务已经逐渐渗透了“衣、食、住、行”这几个关乎民生的重要板块。但在“住”的领域还并没有巨头清晰的影子。当下,1990年至1995年出生的年轻一族,面临着购房装修的需求,成为了家装市场上的消费主力,他们是
学位
在大数据时代,各行各业每天都会产生海量的数据碎片。人们可以通过互联网获取想要的数据信息,但是人脑对信息的查询和存储能力有限,而知识图谱技术能够将复杂多样的信息进行结构化存储,简化人类对信息的检索过程。在知识图谱的构建过程中,共指消解技术可以替换掉文本中相对模糊的短语,从而帮助计算机更好地理解文本的内容,提升计算机对文本中信息抽取的效率。共指消解的目标是找出文本中指向现实世界中同一对象的短语。随着深
学位
报告1例度普利尤单抗治疗6岁儿童特应性皮炎。患儿女,6岁。因躯干和四肢红斑、丘疹伴渗出及瘙痒7个月,加重2个月就诊。皮肤科检查:躯干、四肢可见弥漫性红斑、丘疹、鳞屑及苔藓样斑块,伴渗出及结痂;双手掌可见红斑、水疱及大疱;足底、足跟部可见红斑、丘疹及斑块,伴渗出及结痂。予度普利尤单抗皮下注射治疗(首剂量300 mg,后每3周1次,每次300 mg治疗,治疗12周后改为每4周1次,每次300 mg),
期刊
STEAM(Science-Technology-Engineering-Arts-Mathematics)代表科学、技术、工程、艺术和数学跨学科多元化教育理念,起源于美国且逐渐被中西方国家纳入科学研究并投入实际课堂教学。本研究新增人文学科(Humanities)提出了STEAHM教育理念,基于中美加三国教材中有关“电化学”内容的编排特点,研究了以下问题:1)中美加三国教材在整合广度和表征深度上的
学位
目前,全国奥林匹克竞赛只有信息学竞赛是唯一的非高考科目,但是,信息学竞赛培养了大量的优秀人才,参加竞赛的学生的个人能力和综合素质都十分优秀,所以越来越多的家长和学生开始重视信息学竞赛,并且愿意投入其中。目前初中阶段的竞赛培训课程,课程难度大、任务重,教师面临着庞大的备课量,且参训学生的水平参差不齐,并且没有合适的课堂教材,这导致课程培训效率不高。本研究的目的就是在正确的校本教材开发理念的指导下,探
学位
伴随着新一轮教育改革,国家对于复合型、全面型人才的需求越来越紧迫。英语辩论教育既符合国家对基础教育的社会要求,又符合新课程改革所倡导的理念。英语辩论不仅能锻炼学生的口才,提高学生的外语水平,还能提升学生的综合能力,培养学生的批判性思维,使学生不仅能够在辩论中掌握知识与技巧,还能在非正式的场合中解决实际问题。然而,在具体实践过程中,如何将辩论有效地融入英语课堂中仍受多种因素影响。如何结合英语教材本身
学位