论文部分内容阅读
21世纪以来,随着智能手机与互联网技术的不断发展与革新,移动互联网作为二者结合的产物,近年来发展迅猛。数据显示,2014年中国智能手机保有量达到7.8亿台,移动网民达到5.7亿人,且以飞快的速度在不断增长。随着人们使用智能手机的时长和频数的不断增加,其用户行为数据呈指数级增加。且从智能终端收集的数据具有大数据量、实时性、准确性、空间性、动态性的基本特征。为了解决这一大数据的分析需求,本文从用户角度出发,以2014年第四季度部分手机用户使用APP的行为数据为研究对象,从用户画像的用户属性、用户流失、用户行为三个主要方面进行了研究。首先,研究认为用户画像其是对现实世界中用户的数学建模。用户画像的核心是标签体系的建立。标签是某一种用户特征的符号表示,用户画像可以用标签的集合来表示。其次,依据用户一段时间内的使用行为数据,通过支持向量机、生存分析两种分析方法建立了用户流失预测模型。模型结果表明,对于用户流失的预测准确率基本能达到90%以上,模型预测召回率达到80%以上。最后,使用hadoop中的mahout分析框架,对用户20多项行为指标进行了聚类分析,分析得出了不同阶层的用户人群对于APP的偏好和使用习惯特征。并抽取了某一APP用户行为数据,对其进行了聚类分析,分析认为用户基本可以分为六类人群,依据不同的类型,也给出了相应的挽留策略与营销建议。本文总结和概述了用户画像的定义,分析了标签体系建立的基本流程和统计分析方法。创新性的提出了用户画像研究的三个基本构成要素,即代表用户出生的用户属性、记录用户一生的用户行为、描述用户消失的用户流失。参照流失的定义,依据实际场景对APP用户的流失作了新的定义,并建立模型预测用户流失行为。对于用户画像中用户行为的研究,文章将营销中的FRM指标用于用户行为的分析,结合聚类分析的统计方法,更好的解释和描述了用户的行为特征。