基于时序数据的音乐流媒体用户流失预测

来源 :苏州大学 | 被引量 : 1次 | 上传用户:zsjhmya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,音乐流媒体市场正在不断扩大。各大音乐流媒体服务平台通过多样的方式吸引新用户,抢占市场份额。与此同时,平台老用户根据自身喜好更换平台几乎不需要任何成本,这对于音乐流媒体服务平台来说意味着老用户容易流失。用户流失会对企业利润产生很大的影响,所以准确识别出高流失倾向的用户并实施相应的挽留操作显得尤为重要。目前业界的主流做法是利用数据挖掘和机器学习技术来预测潜在的流失用户。针对音乐流媒体领域用户流失数据的特点以及目前用户流失预测方法存在的问题,本文从模型和特征两个层面来改善流失预测效果,具体的研究工作如下:(1)考虑到音乐流媒体领域的用户流失数据集通常包含大量的时序数据,而LSTM模型常被用来进行序列建模,本文提出一种基于集成LSTM的用户流失预测模型,旨在从模型集成的角度出发提升流失预测效果。该集成模型一方面采用LSTM模型作为基学习器;另一方面结合真实数据的特点改进Snapshot集成方法,在模型训练过程中引入样本权重调整机制,同时利用学习法结合子模型输出。实验结果表明,相比于原始LSTM模型,本文提出的模型在PR-AUC上提升4.21%。(2)由于目前用户流失预测任务中常用模型的结构较为简单,表征能力不强,无法从时序数据中充分挖掘信息,本文提出一种基于LSTM和CNN的用户流失预测模型,旨在从模型结构的角度出发提升流失预测效果。该模型通过组合LSTM和CNN来提升模型的特征学习能力,同时发挥这两个模型的优势。实验结果表明,本文提出的模型相比于原始LSTM模型和CNN模型在PR-AUC上分别提升5.05%和6.08%。(3)针对目前用户流失预测任务中构造手工业务特征需要花费大量人力和时间,以及常用的训练样本选择策略会造成历史数据浪费的问题,本文提出两种不依赖于业务的非手工特征构造方法,以及一种基于特征融合的用户流失预测模型,旨在从特征的角度出发提升流失预测效果。首先,利用现有模型对历史数据进行转化来构造历史数据特征。接着,利用树模型对现有特征进行高阶组合来构造树模型特征。最后将新构造的特征与原始特征进行特征融合并对现有模型进行改进。实验结果表明,同时融合所有特征的模型相比于仅使用原始特征的模型在PR-AUC上提升2.71%。
其他文献
高速公路的修建破坏了沿线自然生态环境,形成大量特殊且生境恶劣的边坡生态系统。探讨其植被恢复规律、群落动态变化、种间竞争规律对于提高路域生态系统生产力、增进生态系统稳定性、定向管理生态系统具有重要的理论与应用价值。目前对于高速公路边坡生态的恢复方法日渐丰富,但边坡植物群落的可持续性和稳定性较差,需依靠大量维护成本的投入才能勉强维持,或需要频繁播种速生草本以达到短期景观效果。究其原因是缺少在前期对边坡
中国主题公园近20年来的发展历程,可以发现中国本土主题公园的发展在经历了2000年以前的大规模开发建设阶段后,普遍呈现出“一年兴,两年盛,三年衰,四年败”的短生命周期特征
目的 1.研究兔肺癌模型肿瘤新生血管及血液供应情况 2.研究射频消融治疗对兔肺癌模型肿瘤组织新生血管及血液供应的影响 方法 选用新西兰白兔建成肺癌模型后,分为治
洳淀粉酶是广泛分布在动物、植物和微生物中的具有重要应用价值的淀粉酶。前期本实验室从海洋宏基因文库中筛选到了一个与己知的α-淀粉酶的序列相似性低于20%的新型α-淀粉
随着我国国民经济的增长和国际地位的提高,我国饭店业赢得了前所未有的发展,作为饭店业重要组成部分的高星级饭店也获得了长足的进步。本文立足于国内高星级饭店发展现状,结合竞争优势理论、产业竞争力理论和演化经济理论,构建了省域高星级饭店竞争力的评价指标体系,运用因子分析法并采用面板数据动态评价省域高星级饭店竞争力,研究其时空演化特征。本文选取2008-2017中国旅游统计相关数据,采用因子分析法对我国省域
本文选用具有双齿特征的、含有咪唑或三氮唑基团的配体,与不同位置取代的噻吩二羧酸,以及借助配体自身的羧酸、不同的过渡金属离子(Zn2+、Cd2+、Cu2+、Co2+)结合。利用水热或溶剂热手段,得到了11个金属-有机配合物。通过一些常规的表征手段,如单晶X-射线衍射(X-ray)、热重分析(TG)、红外光谱(IR)、粉末X-射线衍射(XRD)等,对这些配合物的结构做了详细的表征;同时,根据化合物的结
桃蚜(Myzus persicae)是一种世界性害虫。由于传统的化学防治带来的环境污染和桃蚜抗药性增强等问题,桃蚜的生物防治已成为当前研究的热点。球孢白僵菌是一种重要的生物农药,有
补强证据规则是一种证据的证明力规则,最初来源于刑事诉讼中基于立法政策的目的对特定证据的证明力进行限制而制定的规则,其后逐渐突破刑事诉讼领域而被运用于其他诉讼领域。
目的探讨不同采血量和凝血标本离心转速对凝血项目检测结果的影响。方法随机选取健康成人20例,于清晨空腹采血,在真空采血管中分别加入1、1.5、2、2、2.5、3、3.5 ml全血,以
孕酮(progesterone,PROG)是维持妊娠所需的一种重要类固醇激素。随着研究深入发现神经系统可以合成和分泌孕酮,它是神经系统中一种重要的信号分子,可以影响神经系统的功能。