论文部分内容阅读
近年来,我国二手车交易量迅速扩大,2000年成交量只有25万辆,到2018年己达到1382万辆。规模庞大的中底层收入者是二手车的重要消费群体。二手车市场规模不断扩大的同时,我国二手车市场的价格评估体系却暴露出不适应市场需求的问题,价格评估中的随意性及较多的人为因素,影响了对二手车的合理评估,制约着二手车市场的有序发展。反观国外发达国家,二手车市场能够持续健康稳定地发展是与其合理的价格评估系统密不可分。目前,我国二手车市场仍有巨大的发展空间,二手车市场的有序发展也有利于新车市场以及整个汽车产业的良性发展。因此,寻找更加科学、标准的价格评估方法有重要的现实意义。本文建立了基于随机森林算法的二手车估价模型,进行实证分析研究,将随机森林模型的估价效果与决策树、K邻近算法、神经网络、多元线性回归和岭回归的估价效果进行对比分析。为了更加全面的对二手车价格进行评估,本文梳理了国内外文献后,发现大部分学者在构建数学模型估价时,选取的特征变量较少而无法全面评估二手车的价格。因此本文除了考虑车龄和行驶里程对价格的影响外,还将车辆的功率和类型以及品牌等多个因素也纳入了模型中,并使用随机森林对这些影响因素的重要性进行了度量。本文的研究结果:通过三个评估指标对随机森林模型和其他模型的估价效果进行对比,其中随机森林模型的三个评估指标R2、MAE值和方差得分均表现出最佳。其次为决策树,模型的R2为0.81,其余模型K邻近算法、多元线性回归、岭回归和人工神经网络的R2均低于0.80;在二手车价格的影响因素中,按重要性排名前四的影响因素依次为车龄、功率、里程、型号。其中,功率的重要性大于里程,验证了特征价格理论在指标选取中的适用性。本文建立的随机森林模型能够提供一种适用性更强的方法来评估二手车价格,如针对不同车的品牌、车型以及功率,依据二手车的交易记录即可使用。本文采用的符合实际情况的二手车估价方法,也可以用于电商交易平台的二手车估价问题。