论文部分内容阅读
大数据时代为传统二手房评估方法的改进提供了丰富资源,本文通过爬虫技术获取武汉市大量二手房相关评估指标及售价数据,继而通过GIS技术对其地理位置信息进行可视化分析,并对二手房描述文本使用TF-IDF进行自然语言处理,最后结合其他数值型和分类型指标以随机森林、AdaBoost、GBDT、LightGBM、XGBoost为基模型,BPNN为元模型构建基于两层Stacking框架的二手房估价模型。通过模型训练发现机器学习模型性能明显优于线性多元回归,而Stacking模型表现相较单一模型又有所提升。