探究大数据背景下烟草行业统计分析的思考及应用

来源 :电脑迷·中旬刊 | 被引量 : 0次 | 上传用户:myoooo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:数据爆炸和统计分析新型算法的发展给烟草行业带来了新的机遇和挑战,本文系统的探讨和分析了大数据及统计分析方法在烟草行业的应用和发展,基于不同的研究目的挖掘出潜在有价值的信息,详细列举了其在精益卷烟营销方面的应用,并对统计方法选择、其应用前景和目前的一些问题进行分析和探讨,为推动烟草行业的发展,提高行业竞争力奠定了基础。
  关键词:大数据;统计分析;数据挖掘;烟草
  目前大数据技术在医疗、信息、交通、教育等行业中已经发挥出了巨大的潜力和优势,而处于信息转型升级中的烟草行业也非常重视大数据、云计算等信息新技术在行业信息化发展中的应用。所谓的数据分析技术就是根据人们的目的,从已知的数据中提取出隐含的但又潜在有用的信息,从商业角度看,数据挖掘是一种商业信息分析技术,其主要特点是对大量的商业数据进行提取、转换和分析,从中提取辅助企业运营的关键性数据。基于此,本文对统计分析方法在烟草行业卷烟营销中的应用进行探讨和分析,并针对其存在的问题和前景进行分析和展望,以期为烟草行业的发展注入新的活力。
  1 大数据下统计分析在卷烟营销中的应用
  在传统营销模式下,市场把握更多停留在感性认识,营销决策主要依靠经验判断,货源投放“供非所求、供不应求、供过于求”等现象时有发生,客户需求无法有效满足。为此结合烟草大数据通过数据挖掘技术的探索和研究,运用聚类分析、相关分析和决策树等工具,实现精准精确的销售匹配。
  总体而言,实现烟草市场的精准营销主要基于以下两个方面的工作:一是销售终端基础数据的采集工作,这是大数据运用的基础工作。在烟草销售过程中,虽然能够有效追踪每一笔烟草的流向,但却无法获取个体购買客户的具体的销售信息。比如其购买香烟的周期、口味、品牌偏好等。如果能建立烟草销售数据终端采集系统,记录每一盒香烟的最终售卖对象的具体信息,则能为烟草销售提供更详细的数据以用于更精确的分析。二是销售数据的分析工作,大数据难点还不仅仅在于数据搜集,数据挖掘、分析也是非常关键。数据挖掘除了运用最新的算法和数理统计分析方法外,还需要结合行业特点。烟草行业的客户具有相对稳定性,其客户的增长、减少有一定的规律。所以,关键是要对现有客户群的分析,对地理环境,品牌喜好,年龄分布、烟龄长短、经济水平、吸烟行为等进行有效分析,提出更精准化的营销工作。让客户能够在最短时间内购买到最需要的香烟,合理调整价格,并为客户的健康提供吸烟方面的改进建议。
  具体而言,实现精准营销的数据分析可以从以下几个方面进行
  (1)对客户进行分类。先选用聚类方法对目标市场客户进行分析,基于某种属性的聚集(如地理位置、品牌偏好等)将客户划分为不同类别进行服务和管理。结合各种属性信息建立客户特征模型,实现客户类别化,便于为不同类别不同需求的客户提供个性化服务。
  (2)对烟草品牌的分类。统计客户对不同品牌香烟的而选择及其购买周期、购买习惯等信息,首先进行聚类并定性分析,其次在统计分析软件中以品牌为因变量,客户消费习惯为自变量建立数学模型,建立品牌和用户之间的联系,得到消费者心目中不同香烟品牌的关联替代关系,然后计算出卷烟产品间的相似系数,系数越高则两种产品相互替代的可能性就越大。通过对香烟品牌的划分,企业可以据此对品牌进行调整。
  (3)对产品价格进行定位分析。基于用户对香烟价格的反馈,统计各用户对香烟的心理价位分布空间,结合地理分布和经济发展水平进行统计分析。从地理分布的角度考虑,构建全国各省市香烟价格分布图,及烟民心理价格分布图。或结合当地经济发展水平及消费习惯,预测消费者的价格接受区间,从而对香烟价格进行调整。
  (4)分析和研究客户的行为偏好。通过对不同地区和不同消费人群的研究来确定他们的经济水平、烟龄长短、品牌喜好等特征,建立数据库追踪吸烟者行为模式,利用多年连续数据,统计长时间序列下当地最受欢迎品牌、消费者分布、平均烟龄长短等信息,及时发现流失或潜在的客户群体,为开拓潜在市场和保持客户提供数据依据。
  2 结果与讨论
  计算机技术的进步,很多免费、开源软件和代码也逐渐普及,极大地促进了烟草行业统计分析和数据挖掘工作的发展。目前大数据统计分析技术在烟草行业应用广泛,除了上述应用外,其在工艺管控、烟草专卖执法、烟草农业等方面也有广泛应用,实现了从生产、销售、配送到监管的一体化研究,给烟草行业的发展带来了新的机遇和生机。
  数据分析的过程主要分为以下四个方面。一是描述性分析,主要用均值、方差等描述性统计值来提取重要信息,识别主要特征,主要分析方法有概括性分析、主成分分析、对应分析 和聚类分析。二是解释性分析,需要建立数学模型量化自变量和因变量指间的关系,主要有回归分析和判别分析。三是预测性分析,掌握动态规律,准确预测未来趋势,将表态分析与动态分析有效结合。四是决策制定,基于经过完整分析过程后获取的信息系统深入地分析优先可行方案,以解决实际应用问题。大数据下的统计分析方法除了传统经典的统计分析方法,如能直观分析和判读数据的多元作图可视化、把数据化繁为简的主成分分析、将数据分门别类的聚类分析、诊断识别新样品的判别分析及解析两组变量之间关联的典型相关分析外,还包括由数据挖掘算法出现带来的一系列如时间序列分析、神经网络、遗传算法、分类与回归树、偏最小二乘、支持向量机等新型方法。
  面对众多复杂的统计分析方法,基于不同试验环境选择合适的方法,以应用到正确的实际场景至关重要。一般来说,样本量大小、变量多少、变量类型(离散或连续)、试验或处理的复杂度、数据的时间跨度、研究目的等都会对模型选择产生影响,烟草行业包罗万象,相应的数据需求也较复杂,而目前选择合适的统计分析方法或方法的组合,正确分析试验数据依旧是烟草行业大数据统计发展的一个重要挑战。
其他文献
在中国现代史上,新文学的发展与现代大学的建立有着非常密切的联系。20世纪30年代,山东大学迁往青岛,经历了国立青岛大学(1930-1932)和国立山东大学(1932-1937)时期。这一时期,新文
《红楼梦》是中国古典小说的巅峰之作,代表了中国古典小说创作的最高成就。它在世界各地广泛流传,成为世界文学中的精品。当今社会已经进入了一个以视觉文化为中心的“图像时代
介绍了基于网络技术的变电运行信息管理系统的设计方案,并对统一支撑平台技术、系统动态建模和自适应技术、可视化自定义工作流技术、基于XML规范的数据交换技术的应用进行了
摘要:随着我国科技技术的不断进步,计算机已经成为了国家工业生产、国防科技、技术创新等方面必不可少的电器产品,不仅在军事、工业当中,就连居民的生活、工作当中,计算机也成为不可或缺的产品了,但是在计算机的使用过程中,经常会出现各种各样的问题,其中软件的问题解决起来较为容易,但如果计算机的硬件部分出现了问题,就让我们很头疼了,所以本文就计算机硬件维护技术以及故障解决为主题加以讨论,希望对人们有所帮助。 
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
摘 要:当今社会是个一日千里的信息化社会,网络已于潜濡默转中融入生活中的各个领域,电子政务日愈成为各部门处理日常事务必不可少的工具,本文主要从电子政务网站安全问题入手,进一步探究了电子政务网站安全的具体防护策略,以期为全面提升电子政务网站的安全性,强化电子政务网站安全防护的有效性建言献策。  关键词:电子政务;网站;安全问题;防护  1 电子政务网站安全问题  1.1分布式拒绝服务攻击(DDoS)
《经律异相》是从佛教经律论三藏中摘录资料,按照佛教依正二报关系,以天、地、佛、诸释、菩萨、僧、诸国王等22个主题进行编排的佛教类书,也是一本佛教故事总集。这部书基本将6
摘 要:随着网络科技的发展以及应用的普及,无线局域网在公共场所出现的频率也越来越高。除此之外,手机平板电脑等网络终端持有量的不断增加,也使得其在接入公共无线局域网时,为局域网的安全保障工作带来了不小的挑战。本文以当下公共无线局域网的发展现状为基础,就现阶段公共无线局域网的应用方式以及相关的安全问题加以探析,旨在通过相关研究工作的开展,为今后公共场所无线局域网安全保障工作的开展提供积极的参考。  关
通过对内蒙古伊金霍洛旗城区内公园的调查,选择母亲公园和阿吉奈公园2个典型城市公园,以生长稳定的植物为前提进行实地调查研究。采用定性指标与定量指标相结合的方法进行绿
期刊