基于Bagging-WOA-LightGBM模型的房价指数预测研究——以直辖市数据为例

来源 :河南工业大学 | 被引量 : 0次 | 上传用户:boypoe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
房地产作为我国国民经济的支柱型产业,对促进我国经济发展起到不可或缺的作用。当房地产市场价格波动过于剧烈时,会对我国经济平稳健康运行产生严重的负面影响。因此,加强对房地产市场价格升降趋势的长期监控和精准预测,对预防由于房价剧烈波动而产生的负面影响具有重要意义。然而,由于房地产市场价格影响因素众多,传统预测方法难以实现对房地产市场价格趋势的高精度预测。近年来,机器学习中的集成学习模型,以其优异的预测性能在多个领域预测研究中得到广泛使用。因此,本文通过综合比较现有房价预测研究方法中的优势和不足,提出一种集成学习组合预测模型,并对北京、上海、天津和重庆四个直辖市的房价指数进行实证分析。具体研究内容如下:(1)通过文献分析法从宏观经济、供给和需求三个角度建立四个直辖市房价指数预测初级指标体系,同时通过散点图对各指标与房价指数之间的线性相关性、相关程度进行初步分析。此外,为进一步确保建立的指标体系中各项指标与房价指数高度相关,使用灰色关联度分析法对指标体系进一步筛选,去除各城市数据中灰色关联度系数小于0.7的指标,得到四个直辖市最终房价指数预测指标体系;(2)为避免过早的时间节点数据信息对当期预测结果产生扰动,采用分段预测的方法对数据集进行阶段性划分,使用过去十年房价指数信息作为训练数据,对未来一年的房价指数进行预测。同时,为进一步提高模型在分段预测时的时效性和自适应性,采用滑动时间窗的方法对每一阶段的预测数据进行再划分,以过去三个月的房价指数信息作为模型输入,并将未来一个月的房价指数作为模型输出;(3)建立Bagging-WOA-Light GBM集成学习组合预测模型。以集成学习中Boosting框架下的Light GBM模型作为Bagging集成策略的基学习器,从同时降低方差和偏差的角度出发,有效降低模型预测时的泛化误差,从而提高模型预测效果。同时,为避免Light GBM模型因超参数选择不当产生的预测误差,采用鲸鱼优化算法(Whale Optimization Algorithm,WOA)对Light GBM模型参数进行寻优;(4)通过对四个直辖市相关数据的实证分析,发现与对比模型相比,提出的集成学习组合模型具有较高的预测精度,同时采用Light GBM模型进行特征重要性排序,在四组数据集的训练过程中发现,距离预测月份最近的往期房价指数对预测结果的影响最大。除此之外,研究发现,CPI为北京市房价指数的主要影响因素,汇率为上海市和重庆市房价指数的主要影响因素,而土地价格则是天津市房价指数的主要影响因素。研究表明,本文提出的Bagging-WOA-Light GBM模型能够实现对房价指数的精准预测,可作为我国商品房房价指数预测的辅助手段,同时,基于本文的研究,对政府部门、房地产开发企业和消费者判断房价波动趋势具有重要参考作用。
其他文献
发酵空心挂面是市场新兴的特色挂面产品,其外表光滑圆润,内部有大量空心,煮制后风味浓郁且营养价值高,具有广阔的发展前景。然而,相对于普通挂面及传统手工空心挂面,市场上的机制发酵空心挂面由于制备配方不明确,加工工艺不一致,以及尚未形成相关标准对挂面产品的品质进行评定,导致机制发酵空心挂面产品的品质不统一,相关研究也较少。本课题围绕发酵空心挂面加工中的关键因素,在系统研究配方、工艺、制面规格等对发酵空心
学位
葵花籽壳作为一种常见的生物质废弃物可用来制备生物炭,实现资源化利用。生物炭具有比表面积大和导电性良好等特点,作为载体能够有效提升光催化剂的催化活性。近年来,非金属半导体光催化剂g-C3N4有响应可见光、稳定性好、无毒、无二次污染、易制备等特点,吸引许多科研人员对其进行开发研究。本文以葵花籽壳为原料设计制备出一种高吸附性吸附剂(GSBC)并以此为载体合成了复合光催化剂(g-C3N4/GSBC)用于水
学位
目的 研究面部敏感性皮肤治疗中,予以透明质酸敷料+吡美莫司乳膏的临床效果。方法 便利选取2019年5月—2021年12月在徐州市肿瘤医院接受治疗的78例面部敏感性皮肤患者为研究对象,按照随机数表法均分为两组,单一使用吡美莫司乳膏治疗的39例患者纳入对照组,使用透明质酸敷料+吡美莫司乳膏治疗的39例患者纳入观察组。对比两组患者的治疗效果、皮肤瘙痒程度、灼烧感、生活质量、不良反应发生率。结果观察组在治
期刊
医学图像配准在临床诊断、治疗中发挥着重要作用。随着现代计算机硬件的飞速发展,基于深度学习的医学图像配准方法速度大幅提升。然而,由于卷积神经网络(Convolutional Neural Network,CNN)感受野受限,导致基于CNN的配准模型难以应对内容复杂且存在较大变形的3D脑部磁共振图像(Magnetic Resonance Imaging,MRI)配准任务。此外,配准结果中不真实的交叉折
学位
淀粉是小麦粉的主要成分,以大、小两种淀粉粒的形式存在,即A淀粉粒(A-type starch granule,AS)和B淀粉粒(B-type starch granule,BS)。淀粉的功能在加热过程中尤为突出,其对蒸煮类制品的品质有极其重要的贡献。近年来,国内外有关面粉组分对面条品质影响的研究,主要集中在蛋白质特性对面条品质的影响,而淀粉对面条面团流变特性及挂面品质的贡献尚未得到充分研究。挂面是
学位
农业同时具备自然属性和经济属性,导致农业具有弱质性,因此仅依靠市场机制调解无法达到预期的结果,需要政府“看不见的手”采取一些财政手段来扶植农业健康发展。农业补贴是政府对农业进行宏观调控的手段之一,是国家扶植农业发展的直接政策工具。农机补贴作为农业补贴的内容之一,对农业机械化、智能化转型起着重要的推动作用。2004年我国明确了农机购置补贴政策内容,激发了农户购机积极性,促进了农业机械化发展;2012
学位
期刊
本研究课题通过对东北长粒香大米、河南原阳大米和苏州南粳46大米进行理化指标、蒸煮特性和感官品质分析,筛选出河南原阳大米和苏州南粳46大米作为速冻方便米饭的制作原料,分析大米品种对速冻方便米饭制作工艺和冻藏品质的影响。首先以原阳大米和南粳46为原料,通过单因素试验和正交试验探究了浸泡温度、蒸煮时间和蒸煮压力对米饭感官品质和质构特性的影响,并分析了米饭的质构特性与感官品质的相关性。实验结果表明,以原阳
学位
植物残体和污水处理厂污泥是两类重要的废弃物料。污染土壤上生长的植物可能积累较多的重金属,合理处理这些植物有可能使土壤中重金属减量化,同时也可避免植物资源的浪费。不同污水处理厂的污泥的组成和性质差异较大,部分污水处理厂污泥重金属含量较高,合理处理这类污泥是一个重要课题。本研究通过土施植物残体和城市污泥的方法研究植物残体和城市污泥对土壤的影响,为重金属污染植物和污泥的处理处置提供参考。研究的主要结果有
学位
合理的路网信号控制结构对提高城市交通系统运行效率具有重要意义。本文综合考虑控制性能和计算效率,提出路网交通信号分层分布式控制策略。在控制结构的上层,引入Webster方法实时更新周期时长;在下层,采用模型预测控制方法对交叉口信号控制问题进行建模,以最小化路网总行程时间为目标,优化信号绿信比,并利用Benders分解思路将原问题分解为独立求解单个交叉口信号配时方案的Primal问题和协调优化相邻交叉
期刊