论文部分内容阅读
汽车行业对促进就业,拉动消费影响很大,很大程度上促进了我国经济,特别是制造业的发展。而当前我国汽车市场进入缓慢增长阶段,甚至是负增长阶段,准确预测汽车未来销量无论是从宏观角度还是微观角度都对我国汽车市场有着十分重要的现实意义。销售预测是汽车行业实施可持续经营战略的基本要素。准确的销售预测增强了汽车制造商在优化生产计划过程中的竞争优势。互联网的高速发展,记录了消费者的消费行为,留下了大量的数据。在互联网背景下,如何利用消费者行为数据来提高汽车销量的预测效果成为关键。大量研究使用社交媒体网站的数据来预测线下销量。然而最近的研究也指出,这些数据可能受到各种限制和存在偏见,可能会损害预测的准确性。与此同时,越来越多的研究表明,一种新的在线信息来源,搜索引擎日志,有可能预测线下结果。从销量预测的角度研究这两个重要数据源之间的关系。针对汽车行业这一典型的高卷入度产品领域,结合经济变量,如汽油价格、消费者信心指数来构建基准模型,除了使用百度搜索趋势数据外,还使用了汽车之家中的汽车口碑数据,提出了一种预测技术,探索搜索数据和网络口碑数据在预测中的相互作用,进而预测每月汽车销量。最后考虑了汽车的不同属性的口碑得分,探究影响预测效果的属性口碑,以提高预测的准确性。基于机器学习算法的销量预测模型中,发现在高卷入度产品中,搜索数据提供了消费者留下的数字化痕迹,能够有效地用来增强销量预测。企业可以以几乎零成本的方式研究消费者的网络搜索行为。因此,消费者网络信息搜索有可能成为了解市场购买需求的宝贵资源。在总体口碑数据的基础上,也证明了加入搜索数据的模型能够增加整体口碑数据的预测效果,显著提高预测精度。这一证据表明,嵌入在搜索数据中的销量相关信息是外部的,与嵌入在口碑中的相应信息不重叠。还发现在模型中加入汽车总体口碑得分并不能有效地提高预测能力,而考虑了汽车口碑中各个属性特征的口碑变化情况的模型,能够有效地改进汽车销量预测效果,为以后借助大数据分析方法从海量数据中挖掘有效的预测信息提供了新的研究思路和方法。