论文部分内容阅读
随着我国社会经济的高速发展,旧机动车交易量快速的增长。但由于旧机动车市场发展速度过快,在交易过程中产生了一系列的问题,例如:交易过程中的信息不对称让消费者权益无法得到保障,大量的线下评估工作增加了人力运营成本等问题。因此,在这个高速发展的旧机动车市场中,怎样让消费者能够简单直接的了解到商品的价值,怎样快速地对旧机动车价值进行评估,怎样减少运营的人力成本,是目前亟待解决的问题。本文的主要研究内容如下:1)本文使用了大宗商品价值评估过程中较为常用的特征价格理论,将其应用到旧机动车价值评估领域中。通过使用该方法将旧机动车的价值拆分为21个特征各自的功能和效用价值。按照市场特征向量、汽车自身车况特征向量、汽车损耗特征向量三个大方面对汽车价值进行划分,并按照一定的规则进行量化。特征价格理论具有更高的客观性和更强的可信度,弥补了传统方式对消费者心理感知的忽略。2)使用特征价格理论进行变量的筛选工作后,对数据进行预处理,使其满足模型的应用。在数据预处理阶段,第一步采用人工插补、变量剔除的方式对数据中的缺失值进行填补。第二步使用描述性分析和差值比较法查找出数据中的异常值,并对其进行处理。第三步按照业务角度和市场角度对变量进行编码处理,主要使用了映射序列编码和one-hot编码。最后对数据进行标准化处理,去除数据量纲对模型效果的影响。3)预处理后,本文采用了XGBoost、Extratree、随机森林和CatBoost等四种算法分别对训练集进行训练,获得评估模型。再针对各个模型的泛化性能进行对比,使用RMSE和coverage作为评测指标,挑选出效果最优的模型,建立最终的旧机动车价值评估模型。在训练过程中,CatBoost在coverage(±5%)的范围内泛化能力达到80%以上,相比较优于其他几个模型的表现能力,达到行业应用水平。4)采用CatBoost算法建立旧机动车评估模型,其模型的泛化性能和表现能力优于其他几个模型。利用CatBoost对特征重要性进行排名,判断特征对价值的重要性,使用该方法发现使用时间具有最高的影响性,其次业主期望价格、裸车价格、产量和品牌市场占比分别占据了排名第二位至第五位,我们可以了解到在旧机动车的评估过程中上面的五个特征起到决定性的作用。本文的研究分析,建立了一种基于特征价格理论和CatBoost相结合的旧机动车价值评估模型。通过建立价值评估模型,减少了人工成本的投入,降低了运营成本,减轻了人工评估过程中对车系车型的局限性,提高了评估的准确率。