论文部分内容阅读
“十三五”规划明确提出坚持扩大内需战略,充分挖掘我国内需的巨大潜力,拓展新型消费业态。尤其是在以互联网经济为代表的“新经济”背景下,在线消费作为新型消费业态的代表正逐渐改变着人们的消费观念和方式,在线品牌忠诚在在线消费领域具有极其重要的地位,对于刺激消费和实现企业精准营销、风险管控、决策支持、效率提升和产品设计等商业模式、商业形态甚至商业思维方面的变革,提升企业在在线领域的竞争力具有极其重要的意义。应用科学有效的机器学习方法对在线品牌忠诚进行系统分析和研究具有迫切性和必要性。 在大数据环境下,面对在线消费提供的海量数据信息,传统的技术方法已逐渐无法满足企业创造和维持品牌忠诚的竞争需求。突出表现在传统随机采样方法很难定位具有高品牌忠诚度的消费群体;同时,传统的数据处理技术也无法处理具有海量、混杂和非结构化数据特性的在线消费行为。在面对庞大量级的在线数据,以及如何实时利用在线数据锁定品牌消费群体的需求时,传统的方法具有局限性。本研究的目的就是构建一个在线消费大数据时代下的人工智能模型——机器学习模型,通过机器学习方法,对在线消费者的品牌商品购买行为进行聚类,构建在线品牌忠诚度度量模型,实现具有相似忠诚度的用户的聚类,同时实现在线品牌忠诚度的度量。其中,重点研究机器学习路径、机器学习算法、模型构建方法,以及模型的检验与优化方法。 本研究围绕理论研究——模型设计——模型优化的思路,主要完成以下研究工作: (1)在对品牌忠诚度理论进行国内外研究现状综述的基础上,对在线品牌忠诚度大数据特性和在线品牌忠诚度度量的机器学习方法进行论述。 (2)构建在线品牌忠诚度度量模型是本研究的主体,研究过程遵循在线品牌忠诚度度量的机器学习路径展开。主要包括:1)品牌忠诚度度量的在线数据采集,即通过设计在线数据采集模型和爬虫算法对品牌忠诚度度量相关的在线数据进行采集。2)品牌忠诚度度量的在线数据清洗,即通过设计在线数据检测算法对品牌忠诚度度量的在线数据进行检测;通过设计在线数据清洗算法对品牌忠诚度度量的在线数据进行清洗。3)品牌忠诚度度量的机器学习方法建模,即根据特征选择依据和特征指标定义,通过设计算法完成模型所需的特征构建;在对品牌忠诚度度量模型和模型聚类进行数学定义的基础上,通过设计聚类算法实现模型构建。4)品牌忠诚度度量模型检验,即根据内部有效性指标和外部有效性指标定义,通过设计内部有效性检验算法实现模型内部有效性检验;通过设计外部有效性检验算法实现模型外部有效性检验。 (3)对在线品牌忠诚度度量模型进行优化是本研究的重点。主要研究工作包括通过数据处理优化、特征工程优化和算法调整优化得到最优模型,并从实现在线品牌忠诚度相似用户聚类和实现在线品牌忠诚程度界定两个方面对最优模型进行评价。 本研究的创新点主要包括: (1)针对以大数据处理、大数据价值挖掘和以互联网经济为代表的“新经济”下的在线品牌忠诚度大数据的特性;以及由此带来的在线品牌忠诚度数据分析方式、分析思维、分析技术产生颠覆性变革;在线品牌忠诚度数据生成的多种因素影响;在线品牌忠诚度数据分析的模型和算法高复杂性等方面,首次进行了系统深入的挖掘和剖析,为以互联网经济为代表的“新经济”下的在线品牌消费行为及忠诚度的进一步研究奠定了基础。 (2)提出机器学习方法用于在线品牌忠诚度度量的思路,并实现应用机器学习方法对在线品牌忠诚度模型进行构建,其模型定义在借鉴数据挖掘领域的多维数据立方体概念的基础上进行了改进,进一步拓展了机器学习方法的经济应用领域。 (3)通过全数据分析模式,即样本等于总体的大数据分析模式,实现在线品牌忠诚度相似用户聚类以及在线品牌忠诚程度界定,突破了传统随机采样方法在定位具有高品牌忠诚度消费群体以及传统的数据处理技术处理具有海量、混杂和非结构化数据特性的在线消费行为的局限性。 (4)品牌忠诚度度量模型优化是本研究的重点。其中,特征工程优化是模型优化的核心。而对于聚类方法,存在特征工程适用性问题,本研究在借鉴相关方法思路基础上对具体的特征选择方法进行调整和改进,使其更好的适用于模型优化,具有创新性。