基于随机森林算法的二手车估价模型研究

来源 :北京交通大学 | 被引量 : 14次 | 上传用户:jiu999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国二手车交易量迅速扩大,2000年成交量只有25万辆,到2018年己达到1382万辆。规模庞大的中底层收入者是二手车的重要消费群体。二手车市场规模不断扩大的同时,我国二手车市场的价格评估体系却暴露出不适应市场需求的问题,价格评估中的随意性及较多的人为因素,影响了对二手车的合理评估,制约着二手车市场的有序发展。反观国外发达国家,二手车市场能够持续健康稳定地发展是与其合理的价格评估系统密不可分。目前,我国二手车市场仍有巨大的发展空间,二手车市场的有序发展也有利于新车市场以及整个汽车产业的良性发展。因此,寻找更加科学、标准的价格评估方法有重要的现实意义。本文建立了基于随机森林算法的二手车估价模型,进行实证分析研究,将随机森林模型的估价效果与决策树、K邻近算法、神经网络、多元线性回归和岭回归的估价效果进行对比分析。为了更加全面的对二手车价格进行评估,本文梳理了国内外文献后,发现大部分学者在构建数学模型估价时,选取的特征变量较少而无法全面评估二手车的价格。因此本文除了考虑车龄和行驶里程对价格的影响外,还将车辆的功率和类型以及品牌等多个因素也纳入了模型中,并使用随机森林对这些影响因素的重要性进行了度量。本文的研究结果:通过三个评估指标对随机森林模型和其他模型的估价效果进行对比,其中随机森林模型的三个评估指标R2、MAE值和方差得分均表现出最佳。其次为决策树,模型的R2为0.81,其余模型K邻近算法、多元线性回归、岭回归和人工神经网络的R2均低于0.80;在二手车价格的影响因素中,按重要性排名前四的影响因素依次为车龄、功率、里程、型号。其中,功率的重要性大于里程,验证了特征价格理论在指标选取中的适用性。本文建立的随机森林模型能够提供一种适用性更强的方法来评估二手车价格,如针对不同车的品牌、车型以及功率,依据二手车的交易记录即可使用。本文采用的符合实际情况的二手车估价方法,也可以用于电商交易平台的二手车估价问题。
其他文献
对自交、自由支配、四倍体和三体等遗传计算题,不少学生感到棘手,而巧用图表可以轻松破解此类题。下面举例说明图表法在解答此类试题中的妙用。
目的:对比一次性带气囊硅胶套管与金属套管2种不同材料在气管切开术中应用时对术区皮下气肿、出血、切口股感染及痰痂赌管等并发症的影响。方法:将常规气管切开术患者分2组进
遗传病概率的计算是高中生物学教学的重、难点,通过3个例题阐述了利用集合图形解答遗传病概率的方法。
本文遵循历史和逻辑、理论与实践相统一的原则,研究了马克思理论观的动态发展及其丰富的理论内容,并在此基础上,探讨了马克思理论观的现实意义。 首先,论述了马克思理论观
如何有效开发或开设选修课,拓展学生的知识面,发展学生的特长,培养学生的个性,便成了广大教师需要探索和思考的课题.
【正】 近几年,随着日本情报产业的迅速发展,电子计算机和新的通信设备也广泛应用于农业,各县普遍建立了技术情报系统,促进了农业的发展。广岛县农业技术情报系统(HATIS)利用
翻转课堂是随着信息技术的发展和教学理念的更新而新兴的一种教学模式,实现了知识的传授和知识内化过程的颠倒,充分体现了以"学生为主体"的教学理念。本文把翻转课堂教学模式
<正> 一通化葡萄酒生产工艺(一)原料处理及发酵山葡萄进厂经过检斤、分选、破碎除梗、入发酵池,加入10%酵母进行初发酵,初发酵分离后加糖进行主、后发酵,发酵结束后进行贮藏
随着国家的不断发展,国家对某些特殊部门心理健康问题的重视力度也越来越高。社会对某些特殊部门心理健康工作的现状也引起很多关注。为了更好的实现某些特殊部门的心理健康