基于回归模型集成的精装房房价预测

来源 :兰州大学 | 被引量 : 3次 | 上传用户:liner1018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国经济的快速发展,房地产行业迅速崛起.随着人们生活节奏的加快,精装房也越来越受到青睐,因此能够快速准确对多变量的精装房进行预测,对购房者或售房者都有重要指导意义.国内关于精装房的数据较少,本文便以Ames地区的精装房作为研究对象.首先利用数据之间相关性进行回归模型插补以及基于分类变量的众数或k-means插补进行缺失值的填充,其次根据已经记录的特征变量构造新的影响变量,并对数据进行对数变换及标准化处理.随后根据训练集建立单一预测模型,如线性回归,Ridge回归,Lasso回归等.结果表明:Lasso回归预测效果最好,均方根误差=0.150578,~2=0.926347.单一模型在每个样本点上预测值不具有一致性,本文又建立权重组合模型及Stacking集成模型.权重组合模型中将六个单一模型:Ridge回归模型,Lasso回归模型,ElasticNet回归,GradientBoosting回归,XGBoost回归,随机森林回归的预测方差转化为权重进行加权组合.对比于Lasso回归模型,测试集上减少6.9%,~2提高1%.Stacking集成模型中,将六个单一回归模型预测结果视为新的特征变量建立线性回归模型.对比于Lasso回归模型和权重组合模型,Stacking集成模型的分别减少22.3%,16.6%.~2分别提高1%,2.3%.说明Stacking集成算法对Ames房价预测效果最精确,误差较低,能很好的为购房者或售房者提供参考价值.
其他文献
习近平总书记指出:“中国共产党领导的多党合作和政治协商制度作为我国一项基本政治制度,是中国共产党、中国人民和各民主党派、无党派人士的伟大政治创造,是从中国土壤中生
目的:探讨多巴丝肼(美多芭)联合电针对老年帕金森病( PD)患者血清白细胞介素( IL)-1β、胱抑素C 及血清离子水平的影响及意义。方法选取PD患者72例,随机分为实验组和对照组各36例,对照
2018年中国是全球第二大对外投资国,在全球对外直接投资存量排名中位于第三位。中国对区域全面经济伙伴关系(Regional Comprehensive Economic Partnership,RCEP)国家的投资也在迅猛增长,无论是流量还是存量都远超欧盟。然而RCEP国家国情差异大,政府治理水平参差不齐,存在较高的政治风险,容易损害中国企业的利益。同时随着双重征税受到越来越多的重视,避免双重征税
大蒜的功效成分为大蒜素,是大蒜中大蒜辣素、大蒜新素及多种烯丙醛硫醚化合物等主要成分的总称。经常食用大蒜素可以促进新陈代谢,降低胆固醇,对高血压、高血脂、动脉硬化和
在戴士伟的构想中,未来的多尔克司不仅可以提供安全有保证的奶源,更可以发挥示范效应,改变中国目前传统粗放型的牧业模式,带动中国乳业奶源建设全面掀起生产方式革命。
2015年春,福建茶业市场迎来前所未有的“寒冬”。在一片寒潮之中,专注于生态茶业的中闽魏氏茶业股份公司,却逆市而上。业内人士分析,这和中闽魏氏凭借O2O新营销将企业的发展势头
食用油价格的下跌被认为是行业洗牌升级的节点,未来更多油企选择依靠“油品的提质升级”来维持竞争力。“买大送小”、“买五送一”,很多消费者发现,往年年底都上涨的食用油价格
当下,美国频频对中国施压,敦促人民币升值,将中国对美国的贸易顺差,以及美国国内的经济问题和内部矛盾归咎于中国,寄希望于通过人民币大幅升值来化解。文章通过对人民币升值