论文部分内容阅读
国民经济的持续稳定增长为汽车行业的发展提供了广阔前景,随着汽车需求量的不断增加,汽车行业逐步占据了国民经济中的重要地位.近年来,私家车购买比例迅速上升,越来越多的人倾向于购买私家车.为确定未来家庭轿车的主要消费人群,国家统计局通过调研建立了“私家车欲购车数据”.基于此数据,本文利用数据挖掘方法对该预购车数据进行了分析.
本文主要研究工作如下:
首先,针对究竟哪些消费者将成为潜在的汽车消费者这一问题,本文采用数据挖掘技术中的支持向量机和决策树方法,建立预购车数据分类模型.通过模型不但可以把潜在消费者和非潜在消费者分开,而且还可以对新来消费者在未来三年内买车的可能性进行预测.
其次,考虑到在填写调查问卷的过程中,某些受访者出于保护自身隐私,常常不愿意真实填写其家庭收入,使得我们不能简单地从“家庭收入”来推断其财富状况,本文希望能从其他消费支出指标推断出其拥有财富的大体状况.基于此,用聚类的方法对数据进行了消费者财富指标分析。然后,按照这些指标将消费者进行分群,进而在不同的群体中,分别建立分类模型,对区分潜在消费者和非潜在消费者进行了进一步的研究.
此外,本文还用关联规则方法找出了和潜在消费者关联最密切的一些特征描述,并将各个城市中和消费者关联最密切的特征描述有何异同进行了分析.最后,为了从大量的特征中找出真正能区分潜在的消费者和非潜在的消费者的特征,本文提出了两个新的特征选择方法,实现对预购车数据的特征的约简,找出了包含最具有分类信息的十个特征.