考虑用户生命周期的混合推荐算法设计与实现

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:coldblast
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网高速发展的时代,我们在移动设备上消费是个再正常不过的场景,电商企业现在对于利用营销手段获客,吸引用户进入平台已经不是一件难事,但是由于电商平台竞争激烈,用户选择越来越多,如何在短暂的,碎片化的时间内,使得用户快速对平台内商品激发兴趣,提高用户在电商平台的活跃度,保持长周期的用户留存,并使用户形成消费习惯,成为了电商企业的重大挑战。现在越来多的企业在自己的电商平台引入个性化推荐模块,来提高用户的活跃度。本文以电商平台中推荐模块中个性化推荐算法作为研究主题,因此本文研究了电商推荐算法的发展历程以及当代常用的基于深度学习推荐模型RNN,LSTM,GRU等。由于以用户为中心的互联网营销思维在电商生态中越来越重要,在个性化营销、用户运营的过程中,都会以用户视角来进行企业管理规划。随着这两年个性化推荐算法的发展,虽然运用了很多机器学习、深度学习的技术,但是融入业务内容的用户生命周期理念研究非常少,所以本文将用户生命周期作为切入视角,对现有的深度学习的个性化推荐模型进行优化。本文首先研究了电商用户生命周期的相关理论,着重阐述了用户生命周期中较为经典的AARRR模型。但因为AARRR理论对于本文研究的内容有些局限性,所以本文基于用户行为规律的探索,改进了原有的生命周期理论,提出GMS(Growth Period-成长期,Mature Period-成熟期,Sleeping Period-休眠期)生命周期理论,使之融入电商推荐系统中,更好的帮助电商企业契合在不同生命周期阶段的用户需求,提高推荐的精准度。在不同的生命周期阶段下,用户的行为规律不同,用户主要的需求倾向也不经相同,比如在G-成长期,用户行为具有稀缺性,需要平台做主动的热门商品导购,在M-成熟期,用户对商品的兴趣程度可以通过大量的历史数据获得,而在S-休眠期,则需要部分热门商品导购,加部分历史行为来唤醒用户对平台商品的兴趣。基于这种多阶段的情况,全局使用单一模型并不很好的满足不同用户需求和特征规律,所以本文研究中尝试在不同的用户生命周期阶段选用最合适的算法模型与之匹配,设计出一个基于深度学习的混合推荐算法模型框架,用户分不同阶段来是适配不同阶段模型,进而达到总体推荐模型效果最佳的状态。由于GRU在传统RNN的基础上优化了梯度消失等问题,在LSTM的基础上提升了运算效率,所以本文最终选定GRU作为主要算法之一。另外,为了能够更好的优化在电商场景兴趣度合理分配的问题,所以本文使用了注意力机制,研究加入注意力因子的混合深度学习推荐算法。时间相关的信息是个性化推荐系统中的一个关键特征。一般来说,不同的商品浏览时长反映了用户当前的兴趣度。本文提出了一种将时长相关信息融入注意力机制的GRU模型,通过对用户浏览各商品的时长信息进行分析、清洗和标准化等处理得到时长注意力因子,并将时长注意力因子和其他用户行为数据共同作为深度学习模型的输入信息进行模型训练和预测,更充分地利用了时间信息来提升推荐效果。最后为了验证本文提出的以用户生命周期的混合推荐算法的效果,本文采用了一些单一模型和混合模型,作为对比,例如:RNN,LSTM,CNN,热门推荐算法和不同阶段使用不同模型等基准。并且,还加入了 dropout来优化本文所提出混合推荐算法。本文采用了真实电商平台app的用户行为数据集,该电商平台有丰富的用户规模和用户行为数据,包括380万+的用户行为明细数据。本文训练和测试的模型,都应用于这个电商app的推荐模块中,以此来尝试提高用户在该模块中对于推荐商品的兴趣度。
其他文献
随着国内医疗信息化的发展,医院在为患者提供医疗服务时,积累了大量的数据,大部分为非结构化数据,病理报告就是其中重要的医疗文档。病理报告的内容包括病人的基本信息、大体所见、镜下所见和诊断结果,它是一种非结构化的数据。病理报告的诊断结果被称为“诊断的金标准”,病理医生又被称为“医生的医生”,所以病理报告的内容指导临床的诊断和治疗方向,同时病理报告对制药、医学研究具有重大的价值。但是因为其非结构化的特点
学位
风能开发及应用是我国优化能源结构、实现国家可持续发展的重要支撑,是我国“十三五”能源及电力规划中的重中之重。而当前,我国陆上风电开发方兴未艾,作为风电开发建设关键节点的宏观选址策略及方法基本已经成熟。海上风能资源开发刚刚起步,截止2018年,我们开发的海上风场仍全部是沿海滩涂及水深25m以下的浅海区域,这些海上风场的宏观选址策略也基本类似陆上开展,针对深远海风场的宏观选址方案在国内研究较少。本文基
学位
随着我国经济结构调整,内需消费逐渐成为拉动经济增长的主要动力,个人消费信贷的健康发展可为我国的消费增长提供重要的助力作用。在信贷业务中,风险控制是能否可持续发展的关键要素,而近年来依赖于人行征信和大数据的个人信用风险评估方法仍存在挑战,面临着人行征信覆盖面不全和个人隐私数据被滥用的问题。任何能够验证个人资质的信息,都能够用于辅助判断借款人的信用风险,应该被利用起来,为信贷业务的良性发展提供帮助。保
学位
随着中国旅游行业的发展以及共享经济思想的营销,再加之国家政策扶持,近年来民宿行业发展迅猛,市场竞争也愈加激烈。由于民宿以个体和零散经营为主,缺乏行业间沟通交流于指导,且行业处于初级,行业研究不够深入,更缺乏行业细分市场的差异化研究,因此给民宿经营者带来了较大的经营压力和难度。通过深入研究和分析民宿市场用户关注度和满意度情况能够有效缓解这一问题,为民宿经营者提供管理依据和指导。同时,专业民宿预定平台
学位
2019年9月国务院发布《实施更大规模减税降费后调整中央与地方收入划分改革推进方案》(国发[2019]21号),提出“稳步推进健全地方税体系改革”,将消费税的征收环节后移并稳步地将消费税下划至地方。这一方案的出台意味着将消费税下划地方以完善地方税种已成为财税改革的必然趋势。因此,通过数据预测消费税地方化后对各地区财力所产生的影响,探讨消费税改革将出现的难点,并根据在改革过程中可能出现的问题设计解决
学位
在应急管理中政府承担着重要的角色,我国各级政府现行突发事件应急机制尚有缺陷,尤其是危机信息公开机制。政府作为突发事件危机信息的主要生产者、管理者、发布者,探究应急管理中的政府危机信息公开行为策略具有重要的理论和实践意义,是应急管理理论的深化和完善。为了探究上下级政府在应对危机事件中的联动治理路径,本文基于演化博弈视角,以上下级政府联动治理为研究主体,着重探究了上下级政府的监管与信息公开行为。在综合
学位
随着民宿市场越来越火爆,Airbnb在全球和中国市场获得了飞速发展。在爆炸性的发展下,Airbnb着力于让数据驱动产品,其中智能定价是其重点研究的一项内容,也是业界和社会普遍关注的一项技术热点。但当前的研究结果和实际应用都有进一步提升的需要,因此本文将研究目光聚焦于民宿的智能定价问题。本文依据特征价格理论研究了民宿房源的多特征与租金价格之间的相关性。通过分析整合大量特征数据,运用包括随机森林和XG
学位
可再生能源,特别是光伏发电的广泛应用将成为能源供给发展主流与现实。纵观全球光伏市场,每年光伏新增装机容量增速稳定,新兴市场数量、规模与日俱增。我国光伏累计装机容量已连续5年位于全球首位,行业整体发展趋势向好。当前光伏政策正处于补贴退坡、平价上网的发展时代,投资者面临着更为严苛的投资环境。因此,寻求提升光伏发电经济性能的有效途径是当前亟待解决的科学问题。度电成本,作为国际上衡量光伏发电经济性的重要指
学位
信用违约互换(CDS)是买卖双方关于一个信用事件或信用违约是否发生的交换现金流的双边金融协议。当合约双方中的一方违约时,CDS协议可能在到期日或信用事件发生之前提前终止的风险被称为交易对手信用风险。近年来,随着金融市场中的违约事件和突发事件频繁出现,信用风险己成为金融风险中的一个重要组成部分。因此,对信用风险建立相应的数学模型,并开展深入探讨显得十分迫切和有意义。本论文介绍了2类CDS定价的关键模
学位
海运集装箱运输是当今全球最普遍、主流的运输方式之一。获取较好的物流运费对于相关公司机构的管理部门意义重大。本文将研究集装箱运价中的拼箱价格会受到哪些因素的影响,并尝试获取一个预测性的模型,来帮助相关人士进行运价预测。在此选用海运拼箱价格进行研究,其影响因素与整箱类似,而且其价格更具综合性。论文在介绍了上海发往美国本土目的地的拼箱航运相关内容后,采用了灰色关联分析、多元线性回归分析和时间序列分析三种
学位