基于移动流量数据的电商APP用户行为分类与预测研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:honeypan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,民众购物方式大幅度转型,对于大规模电商APP数据的分析研究具有较高的商业意义和研究价值。对于移动运营商来讲,如何在大规模移动流量数据中快速且有效的甄别电商APP用户的行为类别,如何从用户流量信息中挖掘出更有价值的信息,成为一个重要的研究课题。但传统基于知识工程的人工识别标记用户行为数据的方式耗时耗力,已然不适用于APP数量不断暴增的现状。因此,本论文的核心研究工作就是基于移动DPI流量数据,实现移动电商APP用户行为的自动识别与购买行为预测。具体来说,本论文的主要研究内容如下:1.采集移动DPI数据并完成电商APP用户数据的预处理首先,从移动上网流量中提取国内主流电商APP的URL信息,生成正则表达式文件,完成流量规则识别。其次,基于Hadoop平台上的MapReduce框架,对原始的移动DPI数据进行流量规则匹配,过滤出移动电商APP用户数据集。2.提出基于URL的电商APP用户行为自动识别方法针对电商APP用户数据集中的大规模URL数据,提出基于URL的电商APP用户行为自动识别方法。该方法采用了六种不同的特征提取策略,分别为基本切分方式(Baseline)、消除大小写差异、基于URL组件信息、基于URL组件长度信息、基于Bi-,Tri-grams以及组合词分割。再采用朴素贝叶斯、支持向量机、逻辑回归、决策树及随机森林五种不同的机器学习算法构建多分类模型,实验结果表明所提出的电商APP用户行为自动识别方法准确性超过75%。3.提出基于DPI数据的电商APP用户购买行为预测方法针对移动DPI数据,从用户角度挖掘能够代表用户电商APP购买习惯的特征。并结合基于URL的电商APP用户行为自动识别结果,提出基于滑动窗口的用户购买行为预测方法。实验证明了所提出的用户购买行为预测方法具有较好的效果,并且挖掘新增的用户行为特征可使预测准确性明显升高。
其他文献
miRNAs是小分子非编码RNA,通过抑制mRNA翻译来调节基因表达。自2005年发现毛细胞特异性miRNAs家族—miRNA-183家族以来,miRNAs在听力及前庭系统相关疾病的发病机制中的作用备
目的:分析小儿肺炎支原体肺炎应用X线和CT检查的临床表现。方法:选择我院2016年5月—2018年3月收治的85例小儿肺炎支原体肺炎患儿,均行X线检查和CT检查,将X线检查结果设为对
<正>为进一步支持商业银行拓宽资本补充渠道,提升银行体系稳健性,强化银行支持实体经济的能力,3月12日,银监会、人民银行、证监会、保监会、国家外汇局联合发布了《关于进一
对在环境专业本科教学计划中开设的学生自主实验<资源技术>课程的教学模式、特点等进行了探讨.
<正>"望闻问切"是中医进行疾病诊断和治疗的四诊合一的方法。望诊,就是用眼睛望病人的整体和局部的情况,闻诊;就是用耳朵听、用鼻子闻;问诊,就是看病时医生要仔细询问病人的
会议
随着制作、复制、保存、查找的音视频节目资料越来越多,各种节目之间的交换成为一种必要的手段,而数字存储技术与数字化管理系统是解决音视频节目资源存储、交换、管理的最佳
目的:调查我院肿瘤科门诊和住院肿瘤类患者中药使用情况,为指导临床合理应用抗癌中药提供依据。方法:对2012年1-12月我院肿瘤科诊治的门诊和住院癌症患者的813张中药处方进行
郑单958(豫玉33)在多年的区域和生产试验中表现高产、稳产、优质、高抗和适应性广,因而被广泛应用,到2005年底种植面积已累计达900万hm2。
协同创新是高校思想政治教育创新发展的必然路径。教育主体自身及双方的良性互动是高校思想政治教育协同创新的内在要求和重要内容。文章就主体视阈下高校思想政治教育协同创