基于集成学习的二手车价格预测研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:chenzy43111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着我国经济的发展,群众的生活水平得到了明显提高,我国国民对汽车的需求也是愈来愈大。随着我国汽车保有量的快速增长、国民消费观念的逐渐转变以及互联网的发展,二手车市场得到了迅速的发展。虽然二手车市场的规模不断扩大,但同时也暴露出许多问题特别是缺乏一套科学规范的二手车价格评估体系,这会导致一系列社会问题从而阻碍我国二手车市场健康稳定的发展。建立科学合理的二手车价格评估体系能够减少由于价格、质量等问题引起的社会纠纷,这对我国的二手车市场的蓬勃发展具有重要意义。本文首先梳理了二手车价格研究以及集成学习方法的相关文献,确定了本文的研究思路及理论方法。采用爬虫技术对数据进行搜集,之后对数据进行预处理以及数据特征转换并构造4个新特征。经过数据处理与特征构造后共有85211条数据和34个变量,接着对数据进行探索性分析。本文使用决策树、随机森林、GBDT、XGBoost和LightGBM这5个机器学习方法分别建立二手车价格预测模型。经过参数调优后,在全体数据集上LightGBM模型的综合效果最好,其运行时长为3.9秒,均方误差为1.66。考虑到该均方误差对于价格较低的二手车误差较大,尝试使用一种方法进行改进:先将原始数据集根据新车含税价分为经济型汽车和中高端汽车,之后再分别建立模型进行预测。为了知道使用该方法后模型的效果是否提升,需要与原始方法进行对比。将原始方法中的测试集部分划分为两部分,划分的标准与以上方法相同,并使用训练集得到的模型对这两个部分进行预测并评估。从预测结果发现改进的方法效果更好,因此在实际应用过程中,可以将二手车数据集根据新车含税价划分为两个子数据集,并分别进行训练与测试,达到“分而治之”的效果。在经济型汽车中,LightGBM效果最好,其均方误差为0.41;在中高端汽车中XGBoost效果最好,其均方误差为4.353。本文为了探究哪些特征对二手车价格的影响最大,通过模型输出特征的重要性参数。在经济型汽车中,最为重要的是新车含税价、上牌时长与品牌;在中高端汽车中,最为重要的是上牌时长、新车含税价和最大马力。本文建立的二手车价格预测模型,使用了较为完善的变量,模型预测效果较好。因此本文建立的模型具有实用价值,能够推动二手车价格评估体系的建立。
其他文献
微藻因其细胞内含有丰富的油脂、蛋白质、色素等营养物质被认为是极具发展潜力的生物质替代能源。实现微藻中生物柴油的大规模生产,首先要解决的是其种植、收获和提取步骤中的低产量和高成本限制的问题。因此,微藻的生产量和油脂生产率的优化都是微藻生物燃料生产中的关键。本研究采用植物激素2,4-二氯苯氧乙酸与盐胁迫联合法培养小球藻,研究了小球藻生长情况、胞内生化成分、脂肪酸合成、ROS水平以及抗氧化体系等的变化,
在大学生就业指导工作渗透职业生涯规划教育,可以帮助学生更加全面清晰的认识自我,并在制定科学合理职业生涯规划中,引导学生更好学习和提升实际就业能力,并促进学生更好成长和职业发展。本文联系职业生涯规划在大学生就业指导工作中的作用,对当前大学生职业生涯规划指导存在问题进行细致分析,并尝试从构建职业生涯规划课程、开展持续化规划指导、建立专门规划指导部门、打造职业发展实践平台、开展网络信息化服务等方面入手,
劳动教育是一种有目的、有计划地组织学生参与各类劳动实践或与劳动紧密相关的活动,在思考对话、参与体验中促进学生劳动意识和习惯的养成,进而促进小学生全面发展的教育活动,它是新时代党对教育的新要求。通过劳动教育教导学生爱劳动、爱劳动人民,从小牢固树立正确的劳动态度、情感、习惯和价值观,引导科学的劳动实践,积极发挥劳动的育人功能。以习近平同志为核心的党中央,站在中华民族伟大复兴的战略高度,把劳动教育与德智
在市场经济发展的推动下,企业集团稳步迈入发展期,如何保障企业的平稳持续发展成为企业集团关注的重点。资金是企业集团稳健持续经营的保障,也是财务管理的核心。企业集团能够通过加强资金管理发挥资金增值效应。因此,企业集团应注重选择合理的资金管理模式。随着企业集团的不断发展,其资金管理模式不断优化升级,除较为传统的统收统支外,资金结算中心、财务公司、内部银行和资金池等资金管理模式在越来越多的企业集团中被应用
<正> 南水北调中线工程是从长江中游引水到严重缺水的京津华北地区,缓解京津及华北地区水资源紧缺的重大措施。经研究论证,明确中线调水宜先引汉、后引江,即先从汉江丹江口水库调水,视发展需要再考虑从长江干流引水北调。鉴于南水北调中线工程是一项复杂的系统工程,直接关系到我省汉江中下游防洪、灌溉、供水、航运等各个方面,必须在符合总体流域规划的原则下实施。南水北调中线工程从
会议
旨在研究基于增量动力分析(IDA)方法的地下结构地震易损性分析中地震动记录集规模的选取。基于ABAQUS/Standard软件平台,建立地铁车站结构的土-结构相互作用分析的二维模型,选取了44条远程地震动加速度时程曲线为基准库,采用非线性时程动力分析方法,获取了结构在不同规模地震动记录样本作用下的动力响应。以层间位移角为结构损伤指标,PGA为地震动强度指标,绘制了IDA曲线簇并计算得到了不同工况的
<正> 党的十五届五中全会通过的关于制定“十五”计划的建议中指出:“加紧南水北调工程的前期工作,尽早开工建设”。对南水北调中线工程原则确定先实施第一期工程:丹江口加坝完建、总干渠设计流量350m~3/s,调水80-90亿m~3。南水北调中线工程这个解决我国北方水资源严重短缺
会议
针对二手车资产价值的评估问题进行了相关研究,利用机器学习方法对二手车价格进行预测。通过Python的Pandas库中read.csv()命令对二手车数据进行分析,主要从构建特征指标、数据缺失值的删除和填补、指标异常值的剔除等方面进行数据清洗。提取所需预测的二手车数据,分别使用随机森林(random forest,RF)和Lasso-XGBoost算法模型进行预测。通过对两种算法进行调参优化,对比预
新时代,劳动教育在小学受到高度重视,而劳动教育校本评价是学校劳动教育的重要组成部分,是促进学校劳动教育有效实施的关键。为了促进小学劳动教育的高质量发展,推动劳动教育落地生根,小学劳动教育校本评价实践研究非常必要。小学劳动教育校本评价是基于学校劳动教育内部需求所进行的自主评价方式,是由学校内部人员发起的促进劳动教育发展和提升学生劳动素养为目的的评价,属于以校为本的自主评价,因学校不同而具有各自的独特
国家在高校教育中着力加强素质教育,积极培养更多拥具有高素质、高技能的毕业生。高校在开展职业规划与就业指导课程教学时,应充分利用课程思政教育,提高培养大学生思想道德和综合素养,使大学生树立正确的人生观、价值观,从而更好地解决大学生面对未来的就业问题。