论文部分内容阅读
伴随我国经济的发展,汽车市场日渐繁荣,在新车保有量逐年攀升的同时,也有更多的消费者从观念上接受了二手车。截止2019年底,我国二手车交易量已高达1492.28万辆,交易量的上涨不但促进了二手车行业的发展,也对二手车价值评估提出了更高的要求。但由于我国不同地域的二手车市场发展不平衡,评估数据缺乏、评估信息不对称和评估过程成本高等问题会限制传统三种评估方法的使用。因此,寻找到一种能满足我国二手车市场需求的评估方法十分重要。随机森林作为一种机器学习模型,采用计算机算法实现,在数据处理上有独特的优势,如能够应对样本中有一定噪声和数据缺失的情况,因此本文在二手车价值评估研究中引入随机森林模型。首先,根据均方误差的平均递减程度对分类赋值量化后的15个特征变量进行重要性排序与筛选,组建二手车价值评估的特征变量体系。体系中共有10个特征变量,按照不同属性分为实体变量、功能变量和市场变量三类。其次,通过多次测试对随机森林模型中两个重要参数,单棵决策树每次生长时随机抽取的变量个数和决策树数量的最优选值进行确定,并将样本按照8:2的比例分成训练集和测试集,依据训练集数据建立基于随机森林的二手车价值评估模型。最后,使用测试集进行指标衡量和误差分析检验模型评估精度,选取的衡量指标有模型拟合优度、平均相对误差、平均绝对误差和均方根误差。经过计算分析可知,模型整体运行表现良好,拟合优度高达93.49%,评估值和真实值之间的误差大多集中在10%以下,随机森林模型在二手车价值评估中有较强适用性。且通过对二手车价值评估特征变量体系分析可知,新车价格这一特征变量对二手车价值的重要性最高,其次为上牌时间和行驶里程。本文从理论角度出发,建立了基于随机森林的二手车价值评估模型,在降低评估成本、提高评估效率的同时,还能满足市场的发展需求,为二手车价值评估提供一种新的思路。通过测试集数据实证可知,该模型能够适用于不同品牌、不同配置、不同地域的车辆评估,只需要向模型中投入待评估车辆的信息,就能快速得到评估结果,评估过程简单易操作,模型具有一定的使用价值。