基于Lasso与数据挖掘方法的影响北京二手房价格的因素分析

来源 :北京工业大学 | 被引量 : 15次 | 上传用户:handsomeboywp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的不断发展以及城市化的快速推进,促使了我国房地产市场的迅速发展,与房地产的相关经济活动也越来越频繁。由于城市可供开发的土地越来越少,二手房的交易也变得更加活跃,人们对房地产信息及估价的需求越来越大。无论是从市场参与者的角度,还是从国家开征税费的角度看,二手房价格的精确衡量都是个永恒的话题。快速准确的房地产估价,不仅能为卖方提供合适评估价格、同时为买房提供科学的价格预测,能保障交易双方更高效地推进业务。我国在房地产估价上一般是采用市场比较法、成本法和收益法三种传统评估方法。市场法在评估中大多是靠评估者的经验,容易受评估者的主观影响。近年来为了改善房价评估方法,诸多学者开始将统计建模的方法引入到房地产评估,得到了很好的效果。本文将借鉴国外房地产评估的经验,引入数据挖掘的方法进行二手房价格的预测,建立二手房价格评估模型。基于网络抓取方法从链家网站收集了北京市3万余二手房信息,选取包括建筑特征、区位特征、小区环境等影响二手房价格的38个关键因素。首先用特征选择和Lasso回归两种方法进行初步的特征选择,剔除对评估模型影响不大的因素,减小模型的复杂度,共筛选出33个变量进行下一步的建模。而后进行模型的对比,二手房估价模型主要构建了传统的Lasso模型和4种数据挖掘模型:回归树、Boosting、Bagging以及随机森林。用五折交叉验证法对比5种模型的预测精度,结果显示随机森林模型误差最小,拟合效果最好。最后对随机森林模型进行了参数调整和模型优化,并对测试集数据进行预测,经检验模型拟合效果较好,预测结果有着较高的准确性。表明基于随机森林方法的二手房评估模型是一种值得应用和推广到房地产评估中的方法。从随机森林的变量重要性排序来看,城区、建筑面积、物业费、距离地铁的步行最短距离、房龄等是影响北京市二手房价格的主要因素。
其他文献
我国西部地区气候干燥,蒸发冷却空调系统是一种很有潜力的高温冷源获取途径。伴随着温湿度独立控制理念的提出,蒸发冷却高温冷源与THIC的结合应用前景更加值得在西部地区推广
<正> 3 酯类油的性能 酯类油的物理化学性能与其结构组成有密切关系。德国的Zorn、美国海军研究室的Zisman和Murphy以及美国的Barnes、Fainman和Niedzielski等对揭示酯类油的
低碳经济在珠海的推广和发展得到珠海市政协的大力支持。“太阳能、风能,提高燃气普及率,加快实现公交车的燃气化;提高城市绿化率,提高废弃物处理率。”经过几个月补充、修改的申
2008年2月25日,黑龙江省环境保护工作会议在哈尔滨召开。这次会议是在全省上下全面落实党的十七大、中央经济工作会议和省十次党代会精神,深入落实科学发展观,建设社会主义生
以乌鲁木齐室外气象参数为例,在回收排风能量上,从水泵能耗和风机能耗两方面对热管式间接蒸发冷却方式和传统的间接蒸发冷却方式的能耗进行了分析。研究结果表明,在总能耗方
本文结合客厅中央空调风口设计特点,运用CFD方法对其夏季气流舒适性特性进行了数值模拟,分析了在不同送风方式下,房间的速度场、温度场的情况,并结合实测结果进行比对论证,结
对冷凝器和蒸发器内所含制冷剂量的计算是空调系统充注量计算的关键,而冷凝器和蒸发器内的制冷工质又主要以气液两相状态存在,因此两相区内的制冷剂质量的计算需要选择合适的
对长春市民用建筑四种能源供给方案在同样的负荷水平下,进行节能、环保和经济效果分析。计算四种能源供给系统的一次能源消费量、二氧化碳排放量、初期投资、运行费用和单纯回
本文用数值模拟的方法对再循环自净型排风柜的性能进行分析,当排风柜面风速一定时,改变排风柜出口处污染物浓度来分析经排风柜过滤后的空气携带污染物在房间里的速度场及浓度
对多元平行流蒸发器空气侧百叶窗翅片流动和传热进行了数值模拟。得到了不同迎面风速下的空气温度场、压力场、翅片表面局部换热系数。计算得出的空气侧换热系数和压降与实验