论文部分内容阅读
鉴于我国房产税已经开始试点,但房产的实际价值却缺乏相对客观的评价依据,因此,开展高精度的城市房价批量评估研究有着重要的现实意义和实用价值。本论文基于机器学习方法,以成都市中心城区为例,开展城市房价批量评估方法研究,主要研究内容和研究结果如下:(1)针对目前标准城市房价批量评估基础特征数据集缺失的问题,基于房产信息、兴趣点(Point of Interest,POI)和道路数据开展城市房价基础特征数据集构建研究。通过对获取的房产样本、兴趣点、道路等数据进行预处理,在Arc GIS中构建房价相关数据集;基于房产和兴趣点坐标信息,开展基于兴趣点数据相关的距离和数量的特征计算研究;并开展基于机器学习的城市房价特征选择,从而构建包含房产结构、小区属性和POI相关特征的城市房价基础特征数据集。(2)针对目前POI和道路数据特征提取存在信息缺失的问题,提出一种联合学习框架,开展基于POI和道路数据的城市房价特征联合学习研究。利用卷积神经网络模块提取POI和道路数据核密度图特征,再将提取的核密度图特征和城市房价基础特征数据集输入深度神经网络,并以房产价格为标签训练模型,实现POI和道路数据的房价相关特征表示学习;开展联合学习框架不同的结构和输入尺寸对比实验,得到以残差网络为特征提取器,以256×256为核密度图输入尺寸的最优联合学习框架结构。实验研究结果表明,输入包括基础特征数据集和核密度图数据集的联合学习框架结构的城市房价批量评估建模结果,相较于这两种模态数据集单独作为输入的城市房价批量评估建模结果,本论文提出的基于联合学习框架的城市房价批量评估建模精度平均绝对误差(Mean Absolute Error,MAE)最高提升了1 671.73¥/m~2,相对平均绝对误差(Relative Mean Absolute Error,RMAE)最高提升了9.15%。因此,本论文提出的联合学习框架可以在一定程度上解决POI和道路数据特征提取存在信息缺失的问题,在城市房价批量评估中具有有效性。(3)针对目前城市房价批量评估方法的适用性缺乏评价的问题,开展了城市房价批量评估方法适用性的研究。基于残差网络特征提取器构建的城市房价全特征数据集,开展了6种基于机器学习的城市房价批量评估方法适用性研究。实验研究结果表明,6种城市房价批量评估方法在全特征数据集上相较基础特征数据集上的精度均有提升,其中岭回归方法的精度提升最高,其RMAE提升达4.17%;但极端梯度提升树(e Xtreme Gradient Boosting,XGBoost)和随机森林(Random Forest,RF)效果最优,其RMAE分别为7.37%和7.88%。并开展了城市房价批量评估精度最高的XGBoost,RF、深度神经网络(Deep Neural Network,DNN)等3种城市房价批量评估方法的精度分析,实验研究结果表明,基于RF的城市房价批量评估方法在青羊区内误差最小,基于XGBoost的城市房价批量评估精度在其他区内误差最小。因此,城市房价批量评估方法的适用性在研究区存在空间差异性,但基于XGBoost的城市房价批量评估方法在研究区内误差总体最小。(4)针对城市房价批量评估方法的精度存在空间差异性问题,开展了基于地理加权的Stacking集成学习城市房价批量评估研究。以XGBoost和RF为基学习器,地理加权回归为次级学习器,构建了基于地理加权的Stacking集成学习城市房价批量评估方法,开展城市房价批量评估研究。实验研究结果表明,基于地理加权的Stacking集成学习批量评估建模MAE为1 253.53¥/m~2,均方根误差(Root Mean Square Error,RMSE)为1 837.50¥/m~2,R~2为0.94,RMAE为7.10%。相较于总体最优的XGBoost城市房价批量评估建模MAE提升了51.51¥/m~2,RMSE提升了87.14¥/m~2,R~2提升了0.01,RMAE下降了0.27%。因此,基于地理加权的Stacking集成学习方法可以在一定程度上提高城市房价批量评估的精度。