论文部分内容阅读
摘要:数据爆炸和统计分析新型算法的发展给烟草行业带来了新的机遇和挑战,本文系统的探讨和分析了大数据及统计分析方法在烟草行业的应用和发展,基于不同的研究目的挖掘出潜在有价值的信息,详细列举了其在精益卷烟营销方面的应用,并对统计方法选择、其应用前景和目前的一些问题进行分析和探讨,为推动烟草行业的发展,提高行业竞争力奠定了基础。
关键词:大数据;统计分析;数据挖掘;烟草
目前大数据技术在医疗、信息、交通、教育等行业中已经发挥出了巨大的潜力和优势,而处于信息转型升级中的烟草行业也非常重视大数据、云计算等信息新技术在行业信息化发展中的应用。所谓的数据分析技术就是根据人们的目的,从已知的数据中提取出隐含的但又潜在有用的信息,从商业角度看,数据挖掘是一种商业信息分析技术,其主要特点是对大量的商业数据进行提取、转换和分析,从中提取辅助企业运营的关键性数据。基于此,本文对统计分析方法在烟草行业卷烟营销中的应用进行探讨和分析,并针对其存在的问题和前景进行分析和展望,以期为烟草行业的发展注入新的活力。
1 大数据下统计分析在卷烟营销中的应用
在传统营销模式下,市场把握更多停留在感性认识,营销决策主要依靠经验判断,货源投放“供非所求、供不应求、供过于求”等现象时有发生,客户需求无法有效满足。为此结合烟草大数据通过数据挖掘技术的探索和研究,运用聚类分析、相关分析和决策树等工具,实现精准精确的销售匹配。
总体而言,实现烟草市场的精准营销主要基于以下两个方面的工作:一是销售终端基础数据的采集工作,这是大数据运用的基础工作。在烟草销售过程中,虽然能够有效追踪每一笔烟草的流向,但却无法获取个体购買客户的具体的销售信息。比如其购买香烟的周期、口味、品牌偏好等。如果能建立烟草销售数据终端采集系统,记录每一盒香烟的最终售卖对象的具体信息,则能为烟草销售提供更详细的数据以用于更精确的分析。二是销售数据的分析工作,大数据难点还不仅仅在于数据搜集,数据挖掘、分析也是非常关键。数据挖掘除了运用最新的算法和数理统计分析方法外,还需要结合行业特点。烟草行业的客户具有相对稳定性,其客户的增长、减少有一定的规律。所以,关键是要对现有客户群的分析,对地理环境,品牌喜好,年龄分布、烟龄长短、经济水平、吸烟行为等进行有效分析,提出更精准化的营销工作。让客户能够在最短时间内购买到最需要的香烟,合理调整价格,并为客户的健康提供吸烟方面的改进建议。
具体而言,实现精准营销的数据分析可以从以下几个方面进行
(1)对客户进行分类。先选用聚类方法对目标市场客户进行分析,基于某种属性的聚集(如地理位置、品牌偏好等)将客户划分为不同类别进行服务和管理。结合各种属性信息建立客户特征模型,实现客户类别化,便于为不同类别不同需求的客户提供个性化服务。
(2)对烟草品牌的分类。统计客户对不同品牌香烟的而选择及其购买周期、购买习惯等信息,首先进行聚类并定性分析,其次在统计分析软件中以品牌为因变量,客户消费习惯为自变量建立数学模型,建立品牌和用户之间的联系,得到消费者心目中不同香烟品牌的关联替代关系,然后计算出卷烟产品间的相似系数,系数越高则两种产品相互替代的可能性就越大。通过对香烟品牌的划分,企业可以据此对品牌进行调整。
(3)对产品价格进行定位分析。基于用户对香烟价格的反馈,统计各用户对香烟的心理价位分布空间,结合地理分布和经济发展水平进行统计分析。从地理分布的角度考虑,构建全国各省市香烟价格分布图,及烟民心理价格分布图。或结合当地经济发展水平及消费习惯,预测消费者的价格接受区间,从而对香烟价格进行调整。
(4)分析和研究客户的行为偏好。通过对不同地区和不同消费人群的研究来确定他们的经济水平、烟龄长短、品牌喜好等特征,建立数据库追踪吸烟者行为模式,利用多年连续数据,统计长时间序列下当地最受欢迎品牌、消费者分布、平均烟龄长短等信息,及时发现流失或潜在的客户群体,为开拓潜在市场和保持客户提供数据依据。
2 结果与讨论
计算机技术的进步,很多免费、开源软件和代码也逐渐普及,极大地促进了烟草行业统计分析和数据挖掘工作的发展。目前大数据统计分析技术在烟草行业应用广泛,除了上述应用外,其在工艺管控、烟草专卖执法、烟草农业等方面也有广泛应用,实现了从生产、销售、配送到监管的一体化研究,给烟草行业的发展带来了新的机遇和生机。
数据分析的过程主要分为以下四个方面。一是描述性分析,主要用均值、方差等描述性统计值来提取重要信息,识别主要特征,主要分析方法有概括性分析、主成分分析、对应分析 和聚类分析。二是解释性分析,需要建立数学模型量化自变量和因变量指间的关系,主要有回归分析和判别分析。三是预测性分析,掌握动态规律,准确预测未来趋势,将表态分析与动态分析有效结合。四是决策制定,基于经过完整分析过程后获取的信息系统深入地分析优先可行方案,以解决实际应用问题。大数据下的统计分析方法除了传统经典的统计分析方法,如能直观分析和判读数据的多元作图可视化、把数据化繁为简的主成分分析、将数据分门别类的聚类分析、诊断识别新样品的判别分析及解析两组变量之间关联的典型相关分析外,还包括由数据挖掘算法出现带来的一系列如时间序列分析、神经网络、遗传算法、分类与回归树、偏最小二乘、支持向量机等新型方法。
面对众多复杂的统计分析方法,基于不同试验环境选择合适的方法,以应用到正确的实际场景至关重要。一般来说,样本量大小、变量多少、变量类型(离散或连续)、试验或处理的复杂度、数据的时间跨度、研究目的等都会对模型选择产生影响,烟草行业包罗万象,相应的数据需求也较复杂,而目前选择合适的统计分析方法或方法的组合,正确分析试验数据依旧是烟草行业大数据统计发展的一个重要挑战。
关键词:大数据;统计分析;数据挖掘;烟草
目前大数据技术在医疗、信息、交通、教育等行业中已经发挥出了巨大的潜力和优势,而处于信息转型升级中的烟草行业也非常重视大数据、云计算等信息新技术在行业信息化发展中的应用。所谓的数据分析技术就是根据人们的目的,从已知的数据中提取出隐含的但又潜在有用的信息,从商业角度看,数据挖掘是一种商业信息分析技术,其主要特点是对大量的商业数据进行提取、转换和分析,从中提取辅助企业运营的关键性数据。基于此,本文对统计分析方法在烟草行业卷烟营销中的应用进行探讨和分析,并针对其存在的问题和前景进行分析和展望,以期为烟草行业的发展注入新的活力。
1 大数据下统计分析在卷烟营销中的应用
在传统营销模式下,市场把握更多停留在感性认识,营销决策主要依靠经验判断,货源投放“供非所求、供不应求、供过于求”等现象时有发生,客户需求无法有效满足。为此结合烟草大数据通过数据挖掘技术的探索和研究,运用聚类分析、相关分析和决策树等工具,实现精准精确的销售匹配。
总体而言,实现烟草市场的精准营销主要基于以下两个方面的工作:一是销售终端基础数据的采集工作,这是大数据运用的基础工作。在烟草销售过程中,虽然能够有效追踪每一笔烟草的流向,但却无法获取个体购買客户的具体的销售信息。比如其购买香烟的周期、口味、品牌偏好等。如果能建立烟草销售数据终端采集系统,记录每一盒香烟的最终售卖对象的具体信息,则能为烟草销售提供更详细的数据以用于更精确的分析。二是销售数据的分析工作,大数据难点还不仅仅在于数据搜集,数据挖掘、分析也是非常关键。数据挖掘除了运用最新的算法和数理统计分析方法外,还需要结合行业特点。烟草行业的客户具有相对稳定性,其客户的增长、减少有一定的规律。所以,关键是要对现有客户群的分析,对地理环境,品牌喜好,年龄分布、烟龄长短、经济水平、吸烟行为等进行有效分析,提出更精准化的营销工作。让客户能够在最短时间内购买到最需要的香烟,合理调整价格,并为客户的健康提供吸烟方面的改进建议。
具体而言,实现精准营销的数据分析可以从以下几个方面进行
(1)对客户进行分类。先选用聚类方法对目标市场客户进行分析,基于某种属性的聚集(如地理位置、品牌偏好等)将客户划分为不同类别进行服务和管理。结合各种属性信息建立客户特征模型,实现客户类别化,便于为不同类别不同需求的客户提供个性化服务。
(2)对烟草品牌的分类。统计客户对不同品牌香烟的而选择及其购买周期、购买习惯等信息,首先进行聚类并定性分析,其次在统计分析软件中以品牌为因变量,客户消费习惯为自变量建立数学模型,建立品牌和用户之间的联系,得到消费者心目中不同香烟品牌的关联替代关系,然后计算出卷烟产品间的相似系数,系数越高则两种产品相互替代的可能性就越大。通过对香烟品牌的划分,企业可以据此对品牌进行调整。
(3)对产品价格进行定位分析。基于用户对香烟价格的反馈,统计各用户对香烟的心理价位分布空间,结合地理分布和经济发展水平进行统计分析。从地理分布的角度考虑,构建全国各省市香烟价格分布图,及烟民心理价格分布图。或结合当地经济发展水平及消费习惯,预测消费者的价格接受区间,从而对香烟价格进行调整。
(4)分析和研究客户的行为偏好。通过对不同地区和不同消费人群的研究来确定他们的经济水平、烟龄长短、品牌喜好等特征,建立数据库追踪吸烟者行为模式,利用多年连续数据,统计长时间序列下当地最受欢迎品牌、消费者分布、平均烟龄长短等信息,及时发现流失或潜在的客户群体,为开拓潜在市场和保持客户提供数据依据。
2 结果与讨论
计算机技术的进步,很多免费、开源软件和代码也逐渐普及,极大地促进了烟草行业统计分析和数据挖掘工作的发展。目前大数据统计分析技术在烟草行业应用广泛,除了上述应用外,其在工艺管控、烟草专卖执法、烟草农业等方面也有广泛应用,实现了从生产、销售、配送到监管的一体化研究,给烟草行业的发展带来了新的机遇和生机。
数据分析的过程主要分为以下四个方面。一是描述性分析,主要用均值、方差等描述性统计值来提取重要信息,识别主要特征,主要分析方法有概括性分析、主成分分析、对应分析 和聚类分析。二是解释性分析,需要建立数学模型量化自变量和因变量指间的关系,主要有回归分析和判别分析。三是预测性分析,掌握动态规律,准确预测未来趋势,将表态分析与动态分析有效结合。四是决策制定,基于经过完整分析过程后获取的信息系统深入地分析优先可行方案,以解决实际应用问题。大数据下的统计分析方法除了传统经典的统计分析方法,如能直观分析和判读数据的多元作图可视化、把数据化繁为简的主成分分析、将数据分门别类的聚类分析、诊断识别新样品的判别分析及解析两组变量之间关联的典型相关分析外,还包括由数据挖掘算法出现带来的一系列如时间序列分析、神经网络、遗传算法、分类与回归树、偏最小二乘、支持向量机等新型方法。
面对众多复杂的统计分析方法,基于不同试验环境选择合适的方法,以应用到正确的实际场景至关重要。一般来说,样本量大小、变量多少、变量类型(离散或连续)、试验或处理的复杂度、数据的时间跨度、研究目的等都会对模型选择产生影响,烟草行业包罗万象,相应的数据需求也较复杂,而目前选择合适的统计分析方法或方法的组合,正确分析试验数据依旧是烟草行业大数据统计发展的一个重要挑战。