大数据背景下基于网络搜索数据的商品房价格预测——以武汉市为例

被引量 : 0次 | 上传用户:Green__lucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的发展及互联网的普及,使得消费者在做消费决策时更多的依赖网络搜索获取知识,网络搜索数据的趋势变化就直接反应市场需求的变化,并最终体现在商品市场价格的变化上,商品房房价的变化不外如是。本文基于这一思想,利用我国国内使用范围最广的百度搜索数据对武汉市商品房价格进行拟合和预测,选取与商品房价格搜索相关的119个关键词的百度指数,并用Python对关键词数据进行抓取。数据清洗时分别利用简单手动筛选、Pearson相关系数筛选、线性回归筛选、逐步回归及AIC准则等步骤选出8个关键词作为最终自变量的关键词,分别是:公积金贷款额度,武汉公积金管理中心,公积金提取,按揭贷款利率,金地集团,武汉亿房网,租房子58同城,建材团购。实证研究部分对数据分别建立线性回归、回归树、bagging、随机森林和SVM等5个模型,并比较各模型的拟合和预测效果。结果显示:线性回归模型、随机森林模型和SVM模型拟合效果拟合效果较好且差异不大,其中以随机森林拟合效果最优,但在数据预测时,线性回归模型和SVM预测效果较好,平均误差率分别为1.12%和0.84%。本文所用方法可预测商品房房价领先官方发布数据10-15天。文章最后根据实证结果提出相关建议。
其他文献
眩光是指一种视觉条件,光线进入人眼发生散射,降低了视场的对比度。眩光的产生不仅会给我们的生活带来不便,同时也带来健康和安全的隐患,因此大众对于眩光的关注度越来越高。
本文以云南德钦羊拉铜矿床为例,借助Surpac矿业软件建立了矿床地质数据库,并运用地质统计学的方法,通过分析羊拉5号矿体铜品位分布规律,计算出了厚度、倾向、走向3个方向的实
伴随着社会的迅速发展以及生活水平的不断提升,人们越来越重视精神文化生活。舞蹈这门艺术是通过肢体语言来传达情感的,其要求舞者掌握好各项舞蹈动作与技巧。其中,舞蹈包含
<正>8月31日,十二届全国人大常委会第十次会议表决通过修改预算法的决定,宣告二十年来首次大修、历经四审、长达十年的预算法修订终于尘埃落定。"预算公开"首次入法,是本次预
新疆塔里木油田为了实现高产稳产的目标,钻探更多的水平井,对超深水平井钻井技术进行优化,突破钻井的关键技术措施,尤其超深双台阶水平井钻井技术的应用,取得新的突破。适应
英语非谓语动词教学初探余本仁非谓语动词,包括动词不定式分词和动名词,是高中英语语法教学的重点和难点、在教学中必须牢牢抓往“非谓语”这个本质属性进行系统充分地操练,在此
献县地热的发现与勘探证实 ,该区地热资源水质好 ,埋藏浅 ,地热增温率大 ,有利于开发利用 ,本项研究就河北献县地热特征及开发利用前景进行了探讨 ,填补了该区的地热空白
1958年5月1日,中国第一座电视台"北京电视台"开播,1个多月以后播出的节目《一口菜饼子》被称为中国第一部电视剧。当时,廖廖几百名电视观众目睹了它的播出。中国电视剧史大都
细胞凋亡(apoptosis)是指为维持内环境稳定,由基因控制的细胞自主的、有序的死亡,是维持正常的免疫系统和正常的组织更新所必要的。Caspase-3被证实处于凋亡级联反应的下游,
通过分析人们在互联网搜索过程中留下的搜索数据,我们可以获取许多有用的信息,本文基于人们利用互联网搜索词进行房价预测。从确定种子关键词开始,接下来进行种子关键词扩充,