大数据时代用户游戏内付费预测研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:UltraUnAsm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着手机和网络的普及,游戏产业迎来黄金时代。截止2018年,我国现有游戏用户达到6.26亿人,游戏市场实际销售收入达到2144.4亿元。但另一方面,游戏产业也存在问题亟待解决。游戏产业竞争同质化现象严重,游戏用户增长已到达瓶颈期,游戏厂商难以通过增加用户数量来获利。游戏产业急需引入新的活力。在游戏厂商难以增加用户数量时,筛选出优质用户和潜在付费用户人群已逐渐成为游戏行业的迫切需求。传统的付费预测研究大多采用问卷调查的方式,通过预先设置几个维度采集样本,然后预测用户是否付费,这样既限制了不同算法的应用,而且游戏预测结果难以直接应用到游戏厂商筛选付费用户人群。本论文提出了一种全新的大数据时代预测用户游戏内付费方法,即利用游戏厂商记录游戏用优质用户行为的大数据,预测用户是否会在游戏内付费。本实验数据源有上百个维度、上百万条记录,在实验中搭建了Hadoop和Spark大数据实验平台,为本文研究提供分布式存储和计算能力,解决了传统建模时数据量巨大导致的计算能力不足的问题。本论文数据源高维稀疏、正样本不足1%且数据有脏值,在建模之前进行了数据预处理。清洗数据脏值后对数据进行PCA降维,在保留数据绝大部分信息同时解决了建模时的高维度灾难。采用SMOTE补充正样本避免了传统过采样带来的建模过拟合和欠采样带来的数据信息丢失。在预测用户是否付费时,本论文实现了XGBOOST的分布式计算建模,并采用了传统方法(逻辑回归、决策树、随机森林)和XGBOOST方式对比建模效果。经对比发现,XGBOOST算法在处理此类高维稀疏矩阵时建模预测结果无论精准率还是召回率都普遍更好。在游戏厂商的用户红利逐渐消失时,在现有用户中筛选付费用户人群的重要性不言而喻。本文旨在提出一种大数据时代下预测用户游戏内付费的方法,通过PCA降维、SMOTE补充正样本方法解决数据的维度过多和正负样本不均衡问题。在大数据平台中建立XGBOOST的分布式模型,并与传统的模型预测方法对比,证明XGBOOST在处理高维稀疏和数据量巨大的用户付费预测模型时效果更好。本论文中解决了大数据时代下用户游戏内付费行为研究中的数据量巨大、维度多、数据高度稀疏和数据正负样本极不均衡问题。本文提出的大数据时代下预测用户是否付费的方法避免了传统问卷调查付费研究的实用性不强、研究结果不能被厂商直接采用的弊端。有助于游戏公司筛选出优质用户,提升公司效益。
其他文献
由于专业跨度较大,光电工程专业的计算机信息管理课程的教学效果并不理想.本文从光电工程的专业特点出发,提出一种基于兴趣驱动的计算机信息管理课程的教学方法.通过转变光电
在介绍武汉城市圈物流现状的基础上,以武汉市的GDP和货物周转量为变量构建Logistic增长曲线模型,以探讨区域物流对其经济增长的作用,并提出促进武汉城市圈物流进一步发展的对
本文是以笔者在《当代中国社会建设》一书的翻译项目中担任的部分内容的翻译(第一章和第六章)为考察素材,在分析与反思后归纳和总结成的实践报告。原著《当代中国社会建设》
疲劳失效是目前机械零件最主要的破坏形式,其中多轴疲劳产生的失效占据极其重要的比例,所以针对多轴疲劳问题的研究对机械行业有着深远的意义。由于多轴疲劳问题试验和现有分
替奈普酶作为纤溶酶原的激活剂,可通过催化人体内的纤溶酶原转变成纤溶酶,从而溶解血栓,临床上是治疗心肌梗死的药物。该药物目前国内批准使用的活性检测方法是气泡法,该方法
本文总结了县级融媒体建设过程中各职能部门及各环节需要遵守的网络信息安全操作规范,并提出了相应优化策略与应急预案。
本文主要从人物形象、作家立场、创作风格等三个方面分析《她是一个弱女子》,认为:(1)主人公郑秀岳是“柔弱”的女性,是属于“自叙传”小说中的零余者;(2)作品突出其“柔弱”及悲
我国历来重视文物保护,近些年,更是从国家层面对文物保护提出了更多新要求。作为基层文物工作管理者,面对新的要求与任务,深感责任重大。我们只有增强保护文物的主动性,建立
报纸
中国书院是中国传统文化教育中不可或缺的组成部分,是古代官学的重要补充,是中国古代教育发展史上的一朵奇葩,在中华文化对外传播中发挥了积极作用。研究中国书院的发展历程
"计算机软件技术"是非计算机专业的一门综合性专业基础课。对当前教学过程中面临的问题进行了深入的分析和探讨,并从教学内容设置、教学方法、教学模式、实验和实践管理等几