【摘 要】
:
近年来,住房问题成为全社会关注度较高的热点话题,使用基层数据尤其是数据挖掘等大数据方法进行建模分析,探索住房相关问题的内在规律十分必要。本文运用第六次人口普查中郑
论文部分内容阅读
近年来,住房问题成为全社会关注度较高的热点话题,使用基层数据尤其是数据挖掘等大数据方法进行建模分析,探索住房相关问题的内在规律十分必要。本文运用第六次人口普查中郑州市二七区的长表数据,尝试建立基于哑变量的多元线性回归模型和基于大数据算法的随机森林模型,分别使用SPSS及R软件进行参数估计,探讨了以户为单位人均住房面积与相关普查统计指标之间关系,力求找出影响人均住房面积程度的因素。多元线性回归分析是反映一种现象或事物的数量依多种现象或事物的数量的变动而相应地变动的规律,可用于定量分析和分类分析。当多元线性回归的自变量为定性变量时,就要借助“哑变量”来进行回归;随机森林是一种比较新的机器学习模型,可以很好的预测多达数千个自变量对因变量的作用,且对自变量间的共线性不敏感,被誉为当前最好的算法之一。本文尝试采用这两种模型来对影响以户为单位的人家住房面积的主要因素进行探索。通过建立基于哑变量的多元线性回归模型和随机森林模型对人均住房面积影响因素进行探索分析,得出以下结论:(1)行政区划、本户应登记人数、住房来源、年龄、户别等指标对以户为单位的人均住房面积影响较大。(2)在分类指标较多的情况下,基于大数据算法的随机森林模型较传统多元线性回归模型使用更简便,拟合优度更高,误差更小。
其他文献
马克思的一生有两大重要发现,即唯物史观与剩余价值学说,其中剩余价值理论既是马克思政治经济学理论的基础,也是其最核心的组成部分。在新的历史条件下,全球化的快速发展,经济关系出现了新的变化与特点,马克思剩余价值理论在新的时代面临着诸多的挑战,呈现出时代“局限性”的特征。改革开放以来,我国建立和发展了社会主义市场经济,马克思剩余价值理论成为了指导我国经济发展和构建我国社会主义政治经济学的理论基础,在此背
金矿是世界矿质资源中比较稀缺的一种矿物,由于它的市场需求较大和发展前景良好,金矿的勘查工程也尤为重要。而当下金矿勘查工程中存在的一些问题阻碍其发展,并对市场前景并
从"中国化"到"马克思主义中国化"并非是一个偶然现象,而是一个必然的历史选择过程,从传播学的视角检视这一历史过程,可以得出:中国历史上自古就存在"中国化"现象;"马克思主义
目的对比串联质谱(tandem mass spectrometry,TMS)技术与茚三酮化学荧光法在新生儿高苯丙氨酸血症(hyperhenylalaninemia,HPA)筛查中的应用研究。方法分别采用串联质谱技术和
<正>伴随着我国经济社会发展和城镇化进程的加快,农村集体土地改革已成为土地制度变迁的焦点。十八届三中全会释放出了创新推进农村集体土地流转的积极政策信号。全会《决定
<正>武汉农商行按照"特色化、差异化、精细化"的发展方向,坚持"以加快转型为引擎、以机制改革为抓手、以支持地方为宗旨、以稳健经营为保障、以‘以人为本’为核心价值观",在
本文以对石河子大学图书馆档案管理工作为例的分析,反映出现在高校图书馆普遍存在的档案管理工作中的问题,并提出相应的整改措施,从而提高档案管理工作的效率。
本文在详细评介现代认知语言学的概念隐喻理论主要内容的基础上,讨论概念隐喻理论在大学英语教学上的运用,以英语教学的实例证实:概念隐喻理论提供了分析英语隐喻概念和语言的
较系统地介绍了金堆城钼业公司的概况及生产经营、科技进步和发展前景等。