论文部分内容阅读
消费意愿作为经济、社会、心理学等交叉领域的研究焦点,一直广受学术界关注。消费意愿,是指消费者购买特定产品的主观倾向,是决定消费需求的内在动力。随着互联网的快速发展,互联网已经成为人们生活中必不可少的交流工具,是人们表达各种意愿和观点的重要平台。使用数据挖掘技术探索消费者首要关注指标,已经成为研究消费者意愿的重要途径。本文重点研究多个不同领域消费意愿首要关注指标的概率估计问题、相关关注指标的关联度问题,以及指标影响因素问题,旨在探索消费者需求的内在动力。本研究对于刺激消费需求,促进数据挖掘技术在消费意愿领域的应用,具有重要的现实意义。本文在消费者首要关注指标与数据挖掘相关理论的基础上,运用统计语言模型研究了首要关注指标概率估计问题;使用关联规则分析方法分析了相关关注指标关联度问题;以及运用决策树模型对消费意愿挖掘领域指标影响因素进行了分析。本文的主要研究成果:首先,不同领域消费首要关注指标的概率估计结果:购车主要关注指标分别为价格、安全性、可靠性与品牌,关注概率分别为37.65%、19.43%、10.53%与9.82%;手机主要关注指标分别为处理器、配置性能、内存与品牌,关注概率分别为19.69%、17.32%、11.02%与10.63%;旅游消费主要关注指标分别为景点特色、安全性、开销与服务,关注概率分别为32.5%、20%、15%与10%;餐饮消费主要关注指标分别为味道、就餐环境、特色与人均消费,关注概率分别为30%、26%、18%与10%;教育消费主要关注指标分别为教学质量、口碑、课程设置与师资力量,关注概率分别为25%、20%、17.5%与15%;服装消费主要关注指标分别为款式、做工、面料与品牌,关注概率分别为28.77%、25.57%、23.44%与7.46%;家庭与个人护理用品消费主要关注指标分别为功效、价格、品牌与成分,关注概率分别为28.57%、26.79%、16.07%与12.50%。其次,不同领域消费相关关注指标的关联度分析结果:购车关注指标中,价格与安全性同时在文本中出现概率最高,其规则支持度、置信度与提升度分别约为91.1%、88.9%与1.04;手机消费关注指标中,内存与配置性能同时在文本中出现概率最高,其规则支持度、置信度与提升度依次约为87.5%、89.1%与1.04;旅游消费关注指标中,安全性与开销同时在文本中出现概率最高,其规则支持度、置信度与提升度分别约为82.5%、75.8%与1.01;餐饮消费关注指标中,味道与就餐环境同时在文本中出现概率最高,其规则支持度、置信度与提升度分别约为94.0%、83.0%与1.01;教育消费关注指标中,教学质量与口碑同时在文本中出现概率最高,其规则支持度、置信度与提升度分别约为89.5%、89.7%与1.03;服装消费关注指标中,做工与面料同时在文本中出现概率最高,其规则支持度、置信度与提升度分别约为80.9%、77.6%与1.06;家庭与个人护理用品消费关注指标中,价格与功效同时在文本中出现概率最高,其规则支持度、置信度与提升度依次约为80.4%、88.9%与1.11。最后,不同领域消费指标影响因素的分析结果:总体上,CHAID算法准确率更高。购车关注指标中,品牌是价格指标的最主要影响因素,不关注品牌的消费者有82.7%的概率关注价格,关注品牌的消费者有97.3%的概率关注价格,不关注品牌的类别中,燃油经济性是价格的主要影响因素,而关注品牌类别中,可靠性与燃油经济性是价格的主要影响因素;手机消费关注指标中,配置性能是处理器的最主要影响因素,不关注配置性能的消费者仅有32.8%的概率关注处理器,关注配置性能的消费者有75.2%的概率关注处理器,此类别中,品牌、像素与待机时长是处理器的主要影响因素;旅游消费关注指标中,线路行程是景点特色的最主要影响因素,不关注线路行程的消费者一定关注景点特色,关注线路行程的消费者有93.9%的概率关注景点特色,此类别中,开销是景点特色的主要影响因素;餐饮消费关注指标中,材料新鲜度是味道的最主要影响因素,不关注材料新鲜度的消费者一定关注味道,关注材料新鲜度的消费者有90.9%的概率关注味道,此类别中,营养健康与服务是味道的主要影响因素;教育消费关注指标中,师资力量是教学质量的最主要影响因素,不关注师资力量的消费者一定关注教学质量,关注师资力量的消费者有96.4%的概率关注教学质量,此类别中,服务是教学质量的主要影响因素;服装消费关注指标中,做工是款式的最主要影响因素,不关注做工的消费者有86.4%的概率关注款式,关注做工的消费者有78.7%的概率关注款式;家庭与个人护理用品消费关注指标中,价格是功效的最主要影响因素,不关注价格的消费者仅有46.0%的概率关注功效,关注价格的消费者有90.7%的概率关注功效,此类别中,口碑与成分是功效的主要影响因素。