基于集成学习算法的二手车价格预测

来源 :重庆大学 | 被引量 : 0次 | 上传用户:hgjsy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着二手车限迁政策的全面取消,我国二手车市场正迎来巨大的发展机遇。然而当下我国二手车交易市场却面临“柠檬市场”萌芽的问题:消费者与二手车销售方之间信息不对称,致使市场中产生信任赤字,进一步导致劣质品充斥市场,优质品被逐出市场。这毫无疑问会制约我国二手车市场发展潜力的进一步释放。因此,打破这种信息不对称的局面,构建一套透明、合理的二手车定价机制就显得尤为必要。本研究主要基于人人二手车网的二手车交易数据进行研究,拟通过数据分析为二手车价格的制定提供理论支撑。在描述分析部分,笔者对影响二手车价格的特征进行了相关性分析,并且以厂商、车型、排量这三个特征为例对新车售价与二手车售价进行了对比分析,从资产保值的角度为消费者提出了购买建议。在建模分析部分,笔者首先基于XGBoost算法对数据进行了拟合,进一步地,运用集成学习算法中boosting派系下的GBDT算法、Cat Boost算法,bagging派系下的随机森林算法进行特征筛选,并运用网格搜索方法对模型参数进行优化,从而在保证预测准确性的基础上尽可能地简化XGBoost模型输入。结论表明,基于随机森林算法进行特征筛选后的XGBoost模型,即RF_XGBoost模型在本研究数据上表现最好,平均绝对误差(MAE)由未经特征筛选时的1.1716降低到了1.1533,而拟合优度(R~2)由0.9082提高到了0.9299。此外,RF_XGBoost模型中对二手车价格而言最具重要性的特征包括:行驶里程、新车售价、车牌所在地、长度、高度、轴距、排量、行李厢容积、变速箱、档位个数、车型、排量、驻车制动类型、驱动方式。经过笔者对相关资料的查询,这些数据特征都是具有实际预测价值并且也较容易获取的。最后,笔者建议消费者理性购买汽车,在充分考虑个人实际需求的前提下,还要考虑到不同配置汽车的折价率,选择性价比最高的汽车;建议二手车销售平台方透明化二手车定价,并全面考虑二手车的各个配置指标,建立一套更为科学的定价体系,共同促进二手车市场的平稳发展。
其他文献
目的:检验超声测量肩袖损伤合并肩胛骨动力障碍(scapular dyskinesis,SD)患者的肩胛骨相关肌肉厚度的重测信度及评估者间信度,探讨不同SD分型、疼痛病程及疼痛程度下肌肉静息厚度和收缩幅度改变,为临床制定个体化康复方案提供理论依据。方法:第一部分由两名评估者各自使用超声对36例肩袖损伤合并SD患者双侧上斜方肌(upper trapezius,UT)、中斜方肌(middle trape
学位
目的:观察重复经颅磁刺激(repetitive transcranial magnetic stimulation,rTMS)联合吸气肌训练(inspiratory muscle training,IMT)对缺血性脑卒中患者膈肌相关参数,肺功能,吸气肌功能,运动阈值及日常生活能力的影响。方法:将93例存在肺功能障碍的脑卒中患者,随机分为常规组,IMT组(吸气肌训练组)和联合组(重复经颅磁刺激联合吸
学位
第一部分 sirtuin家族在异基因造血干细胞移植后急性移植物抗宿主病中的作用目的探究sirtuin家族在异基因造血干细胞移植后急性移植物抗宿主病中的作用。方法本课题首先在体外进行混合淋巴细胞培养(Mixed Lymphocyte Reaction,MLR),将Balb/C小鼠去除T细胞的脾脏细胞与C57BL/6小鼠的T细胞混合培养,使用细胞增殖染料CTV标记效应细胞,按0μg/ml、1μg/ml
学位
目的本研究旨在为稳定期慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)患者构建一套基于微信小程序的运动方案,并探究该方案对稳定期COPD患者体力活动水平等指标的影响。方法本研究分为两部分,第一部分首先通过文献回顾、课题组讨论和预实验,制定运动方案;研究者以该方案为基础并融入行为改变技术,完成微信小程序的开发。第二部分为基于微信小程序的运动方案
学位
背景:在急性髓系白血病(acute myeloid leukemia,AML)中,既往认为细胞遗传学是预测疾病缓解率、复发率及总体生存率最重要的指标,近年来随着高通量测序,RNA测序以及全基因组测序等新技术的发展,分子生物学指标对于预后的意义得到不断的认识。在此基础上,我们对一例多次复发的正常核型AML患者进行了 RNA测序,发现并鉴定了 CTCF-ETO2和ETO2-CTCF新融合基因。ETO2
学位
随着高频通信技术的发展,对于频率更高的电磁波的研究与拓展逐渐成为众多科研工作者关注重点。近几年来,太赫兹技术由于其高信噪比、高穿透性、高相干性等特点成为研究热点,但太赫兹波段的器件与应用还相对较少。另外,三维光子晶体的制备难度随着革命性的增材制造技术——三维打印工艺的发展而逐步降低,其中网格结构由于具有力学的自支撑性、结构的多样性和三维打印的友好性受到强烈关注。本论文基于两种立体网格结构,采用光固
学位
第一部分 嵌合抗原受体T细胞治疗复发难治性淋巴瘤的安全性及有效性分析目的:1.探索本中心CAR-T细胞在复发难治性淋巴瘤患者中产生的安全性及有效性。2.探讨影响CAR-T治疗复发难治性淋巴瘤患者疗效及安全性的相关因素。方法:2017年03 月至 2020年09月期间经过筛选符合纳排标准的CD19/CD20/CD22/CD30阳性复发、难治恶性淋巴瘤患者,在接受氟达拉滨联合环磷酰胺预处理后第三天接受
学位
随着电商的兴起,传统百货零售面临着更加激烈的市场竞争,零售商因为市场竞争积压了更多库存。为应对当前零售行业的市场现状,尾货折扣产品零售商应运而生,满足了不同市场风险下供应链和消费者的需求。与此同时,消费者的购买选择愈发丰富,消费者的策略性行为对零售商的收益影响越来越大,研究消费者预期行为的重要性凸显。零售商通常会采用更多样化的促销策略来减少消费者策略等待和后悔心理,本文创新性在跨期销售和退货策略实
学位
随着数字化转型升级和消费边界的拓展,通过“渠道整合”创造竞争优势、谋求高质量发展受到了国内外各行业品牌商的重视。多渠道的购物环境为消费者提供了很多的购物选择,也为企业带来了渠道冲突和竞争。对于服装品牌而言,线上渠道以其方便快捷的购物体验为消费者所青睐,但线下体验作为消费者购买决策的重要因素也十分重要。在此背景下,通过跨渠道整合实现渠道间优势互补十分必要。文章将以服装品牌为研究对象,探索跨渠道整合对
学位
突发事件对各个行业的供应链都产生着巨大的冲击,如本次新冠疫情就造成了众多供应链的不畅甚至中断,严重影响了社会经济的正常发展。突发事件通常会给供应链企业带来供应扰动甚至中断的风险,因此决策者在突发事件下会选择保留后备供应商,且在不同情形下会具有不同的风险厌恶态度;除此之外,供应链上的成员会隐藏私人信息以获取更多的收益,使得供应链存在信息不对称的现象,进一步降低供应链的绩效。因此,突发事件下考虑供应中
学位