大数据背景下用户画像的统计方法实践研究

来源 :首都经济贸易大学 | 被引量 : 129次 | 上传用户:fengljx1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪以来,随着智能手机与互联网技术的不断发展与革新,移动互联网作为二者结合的产物,近年来发展迅猛。数据显示,2014年中国智能手机保有量达到7.8亿台,移动网民达到5.7亿人,且以飞快的速度在不断增长。随着人们使用智能手机的时长和频数的不断增加,其用户行为数据呈指数级增加。且从智能终端收集的数据具有大数据量、实时性、准确性、空间性、动态性的基本特征。为了解决这一大数据的分析需求,本文从用户角度出发,以2014年第四季度部分手机用户使用APP的行为数据为研究对象,从用户画像的用户属性、用户流失、用户行为三个主要方面进行了研究。首先,研究认为用户画像其是对现实世界中用户的数学建模。用户画像的核心是标签体系的建立。标签是某一种用户特征的符号表示,用户画像可以用标签的集合来表示。其次,依据用户一段时间内的使用行为数据,通过支持向量机、生存分析两种分析方法建立了用户流失预测模型。模型结果表明,对于用户流失的预测准确率基本能达到90%以上,模型预测召回率达到80%以上。最后,使用hadoop中的mahout分析框架,对用户20多项行为指标进行了聚类分析,分析得出了不同阶层的用户人群对于APP的偏好和使用习惯特征。并抽取了某一APP用户行为数据,对其进行了聚类分析,分析认为用户基本可以分为六类人群,依据不同的类型,也给出了相应的挽留策略与营销建议。本文总结和概述了用户画像的定义,分析了标签体系建立的基本流程和统计分析方法。创新性的提出了用户画像研究的三个基本构成要素,即代表用户出生的用户属性、记录用户一生的用户行为、描述用户消失的用户流失。参照流失的定义,依据实际场景对APP用户的流失作了新的定义,并建立模型预测用户流失行为。对于用户画像中用户行为的研究,文章将营销中的FRM指标用于用户行为的分析,结合聚类分析的统计方法,更好的解释和描述了用户的行为特征。
其他文献
随着城市日新月异的变化更新,人们对于绿色建筑的要求也越来越高。既有建筑绿色改造已成为一种节约城市资源和降低建筑能耗的有效改造方式,"微更新"城市设计理念更是为既有建
在服装多元化人文化发展的今天,礼服正在逐渐成为服装分类中的重要组成部分,礼服设计语言独特,最具服装文化艺术与工艺技术的代表性,需求面已越来越广泛,礼服设计的方向也在
急性胰腺炎(AP)作为临床上的重急症之一,是胰腺的一种潜在致命性疾病,其发病机制尚未明确。目前研究多认为胰腺的异常自噬作用参与了胰酶的提前活化过程,从而导致AP发生,研究
函数贯穿高中数学学习的始终,不但概念多、知识广、思想方法丰富,而且与集合、不等式、方程、导数等内容紧密相关,是锻炼学生数学能力,形成数学核心素养的重要内容。学生在函
对山东省民营中小企业融资现状及成因进行了分析,并借鉴日美发达国家解决中小企业融资难题的经验,为解决山东省民营中小企业融资难问题提出了应对策略:提高民营中小企业自身
2009年央行推行人民币跨境贸易结算试点以来,人民币国际化已取得较大进展,但是资本账户管制带来的负面影响也更加明显。资本账户开放并非货币国际化的必然前提,但是一国货币
林权泽的《西便制》以韩国全罗南道民乐"盘索里"为题材,表现了凝聚在其中的传统文化之精髓,展示着对韩国传统文化艺术的热爱与偏执。韩国各阶层观众,在《西便制》的牵引下,重
立法精英作为法律制度的设计者,除了应具有良好的法律专业技术知识,还应具有优良的德性,这是立法精英创制良法,防止立法腐败的道德保障。理性是立法精英的首要德性,在于法律
<正>所谓"支架式"教学模式,是指首先给学生一个学习的范围,确定学生在这个范围中可以自由地探索,以此为教学结构进行的教学。"支架式"教学模式是一种让学生自主探究学习的一
随着近几年互联网的迅猛发展,大量企业进入到电子商务领域,借助电商平台来进行产品的营销和推广。信息技术借助互联网快速发展,互联网金融模式逐渐兴起。大数据时代的到来对