基于Hadoop的全国零售户数据处理与市场感知

被引量 : 0次 | 上传用户:wupengzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来互联网的发展,促使了“互联网+”的兴起,烟草企业已经拥有了庞大的零售户信息数据。零售户在全国范围内的数量已经超过了800万家,每月都会产生大量订单信息,随着时间的推移,这个订单信息数据量已经达到TB级别。然而,企业最初搭建的硬件设备和软件不具有存储和处理这些数据的能力,因此导致有价值的信息无法提取出来,形成一个尴尬的局面。本文结合全国零售户不断剧增的信息数据与现有的大数据存储技术,提出了基于Hadoop的全国零售户订单数据分析系统的架构,详细分析了Hadoop集群节点存储性能和响应时间,实现了海量数据的存储与处理。基于ARIMA预测模型,建立了销售预测模型,并对该模型进行了验证,根据预测提出了基于预测的营销模式,还提出了对零售户终身价值的计算方式,为决策者提供对零售户的忠诚度提升策略。具体研究内容如下:1)根据全国零售户订单数据的性质,提出了一种基于Hive的数据存储模型,该模型是对海量数据进行分区管理,采用月单位划分数据分区表。采用该模型解决针对全国零售户订单数据的应用存储和负载均衡问题。2)探讨了对整个HDFS常用的数据处理办法,并根据存储数据的实际情况,提出了一个在异构集群下减少数据处理的响应时间的算法,该算法是分析集群性质和对集群处理数据的执行响应时间提出一种基于节点计算性能的数据分配策略。针对全国零售户数据,运用该分配策略建立一个数据处理模型,降低数据在网络上传输,防止数据拥塞,提供集群的时效性。3)企业具有敏锐的市场感知、把握市场动态和市场方向的能力,关键在于对大数据的挖掘。本文从市场感知和市场响应角度,在大数据的基础上,运用ARIMA销售预测模型来预测市场销售,并且提出了一种计算零售户市场价值、忠诚度的方法,缓解重要决策对个人经验的依赖,为品牌投放和市场响应提供了有效的信息支撑。4)基于Hadoop的数据存储技术建立了一个大数据处理平台,设计了一个以企业产生的零售数据为导向的数据存储的生态大循环、以战略为牵引的大数据平台中循环和以数据信息为核心的数据同步处理的内部3个生态小循环的三层生态循环系统架构。
其他文献
对木霉菌Th B的生长温度、pH范围、碳氮营养要求以及对6种常用化学杀菌剂的耐受程度进行了研究。结果表明,该菌株在15~35℃下均能生长,其最适生长温度为25~30℃;在pH5~8之间均能
目的探讨结直肠癌伴肝转移患者原发灶胸腺嘧啶磷酸化酶(TP)、二氢吡啶脱氢酶(DPD)表达与XELOX(希罗达+奥沙利铂)化疗方案疗效和毒副作用的关系。方法结直肠癌伴肝转移患者行
全面介绍一个大型校园网集成方案的设计,总体上以网络集成和信息系统集成为设计思想,将该系统集成划分为若干子系统进行介绍.
以离子交换树脂为催化剂,对甲酚和MTBE为原料合成抗氧剂T501,通过对催化剂及工艺条件的探索,得到了T501含量较高的烷化液(质量百分含量60%),比同类报高28个百分点。
讨论了高维球面上曲线的一则整体性质,该性质是二维球面上Crofton公式的推广.立足于积分几何,利用活动标架法,对Crofton公式在高维球面上的版本给出了一则简洁证明.
讨论了NBR/PVC共混胶与BR并用、相容剂、硫化体系、补强体系和增塑体系对配方硫化胶低温耐寒性能、耐油性和相关力学性能的影响,研制出了具有优良耐寒性能和力学性能的耐寒制
对核桃渣中油脂和蛋白质进行了水剂法同步提取分离工艺研究。经单因素实验,获得了适宜的工艺条件为:兑水pH 11.5,料液比(g∶ml)1∶8,浸提温度50℃和浸提时间5 h。在此条件下,
目的观察枣柏宁颗粒治疗脑卒中后焦虑的治疗效果。方法 66例符合条件的脑卒中后焦虑患者随机分为2组,均给予神经内科常规治疗,治疗组加用枣柏宁颗粒口服,对照组予以氟哌噻吨
随着我国市场经济机制的日趋完善以及我国越来越多的企业走向世界,而国外企业也前所未有的对中国这个充满商机与潜力无限的市场更加看重,寻求与中国企业的合作,税收筹划以及
目的观察六味地黄加味胶囊对糖尿病肾病(DN)大鼠肾脏的保护作用,对肾脏蛋白激酶C(PKC)活性及结缔组织生长因子(CTGF)表达的影响。方法ip链脲佐菌素(STZ)建立大鼠DN模型,模型