论文部分内容阅读
作为汽车售后服务行业的标志性服务供应商4S店,企业现已使用的各种应用软件系统为企业细化和标准了服务流程,也存储了大量的历史数据信息,企业决策管理层意识到这些数据的宝贵性,但在利用性方面不是太理想。国内的4S店本身起步就比较晚,发展至今各个方面还尚不十分完善,因此售后服务质量提升的空间很大。在这个特定环境下,对企业己有历史数据做数据挖掘的应用将为企业的进一步发展做出巨大的贡献。本文的任务是在4S店的已有数据库资源的基础上提取与汽车维修保养相关的数据,建立基于汽车售后服务业的数据仓库系统,并对提取的数据做数据清洗和ETL处理后存入已建立的数据仓库,然后应用关联规则和统计分析的方法做数据挖掘的应用研究。从两个方面入手,第一是对4S店的车辆维修项目做关联分析,研究车辆维修项目的历史数据,分析在某一时间段内维修项目之间的关联关系,针对这些关系做评价分析,预测客户可能的驾驶习惯并给与相应的个性化提示。第二是对企业的透明车间数据做统计分析,为车间车位分配和维修团队的作业调度提供数据支撑,在最大程度利用企业资源的情况下合理调度维修团队来提高企业的服务质量和效率。本文针对经典Apriori关联规则算法进行实验研究,对该算法所产生大量频繁项集和多次重复访问事物数据这两个缺点而导致的耗时问题,本位采用基于FP-Tree技术改进的Apriori算法,FP-Tree算法不使用候选项集,而且直接压缩数据库成一个频繁模式数,再通过这个树生成关联规则,在效率上有明显提高。本文对数据挖掘前的数据预处理和数据挖掘后的结果分析与展示也进行了一定的研究,针对企业数据特点,进行数据转换来适应算法的应用,基本达到较好的结果。对挖掘结果以分析报告形式展示给客户,并给予个性化提示,对企业提高售后服务质量有定的指导意义。