论文部分内容阅读
人口密度是研究人口分布规律的测度指标,高分辨率人口密度图是提高城市规划水平、改善应急管理能力、优化资源配置的重要基础数据。编制人口密度图,往往受基础数据的严重制约。有什么样的基础数据,人们就会构造与基础数据相配套的人口密度计算模型。大数据时代,自然禀赋、经济禀赋和创新禀赋数据极大丰富,为编制高分辨率人口密度图提供了数据基础。人工智能时代,机器学习算法为编制人口密度图提供了非线性算法。本文以石家庄地区为人口密度制图实验区,在乡、村两级分别采样,构造对应的样本数据集,借助随机森林模型,开展了人口密度制图实验工作。首先,基于POI数据,开展人口密度制图实验。通过分析得出:⑴在基于POI核密度的人口密度图(x_rkmdp、c_rkmdp)中,城镇周边的人口密度普遍存在“杜能环”结构,人口密度自城镇向乡村快速降低;⑵在基于POI距离的人口密度图(x_rkmdd、c_rkmdd)中,存在人口密度的“点—轴”结构,“点-轴”附近的人口密度明显偏高,反映出经济区位和交通区位显著影响人口分布特征。其次,按照自然禀赋、经济禀赋、创新禀赋三个维度,遴选人口密度影响因子,开展人口密度制图实验。选取归一化植被指数(NDVI)、数字高程模型(DEM)、地形起伏度、距河流距离、年平均气温、年平均降水量表征自然禀赋特征,选取夜间灯光影像(NTL)、交通通达度表征经济禀赋特征,选取POI距离组合图、POI核密度组合图表征创新禀赋特征,共同刻画影响人口密度的综合禀赋空间,基于随机森林模型,编制乡级尺度和村级尺度基于综合影响因子的人口密度图(x_rkmd、c_rkmd)。将本文获得的6套人口密度图与多尺度人口密度图(R=13、R=30、R=100)、sjz_WorldPop人口密度图(2007年)、sjz_PoiPop人口密度图(2010年)、sjz_CnPop人口密度图(2010年)对比,形成如下新认识:⑴随着训练样本数据集的采样精度由县级尺度细化到村级尺度,城镇地区的人口密度过低估计和乡村地区的人口密度过高估计得到明显改善;⑵基于随机森林模型的人口密度制图算法,无论是按县采样,还是按乡采样,还是按村采样,由于采样单元(县、乡、村)与输出单元(100m×100m)不匹配,从理论上讲,均存在“区群谬误”问题,克服“区群谬误”是改善基于随机森林人口密度模型的关键;⑶通过引入POI距离数据,能够刻画出人口密度的“点—轴”结构;⑷通过引入POI核密度数据,能够刻画出人口密度的“杜能环”结构;⑸自然河流对人口密度有显著影响,人工河流对人口密度无显著影响,如果将自然河流和人工河流混为河流带入随机森林模型,将对人口密度图产生错误干扰;⑹夜间灯光具有“泛化效应”,用POI核密度组合图替代夜间灯光影像,将改善人口密度图质量;⑺为保障人口密度数据集的计算效度,需有区别、有选择地引入POI数据;⑻当研究区内存在自相矛盾的人口分布法则时(例如:自然河流,若是地处山区,两侧的人口密度就会高;若是地处平原,两侧的人口密度就会低),此时单靠随机森林模型已经无法克服,必须先将研究区分为山区和平原,再分别应用随机森林模型方可克服;⑼城市地区和乡村地区的人口演化路径不同,对城乡进行分区,会进一步改善人口密度制图精度。研究表明,未来开展高分辨率人口密度制图,需首先开展自然综合区划(地貌分区)和城乡区划,按照综合禀赋开展分区,再分区运用随机森林模型,则有望提高人口密度制图效度。要精细制作各类禀赋因子,如河流数据集应当只含自然河流数据,而不应引入人工河流(运河、减河、灌渠等)数据;用POI核密度组合图替代夜间灯光影像,将提高城市区位因子的精细化水平;在创新禀赋数据中应按照是否有利于开展信息沟通,遴选POI数据。依托最小粒度人口密度数据,分区展开随机抽样,分区构建人口密度训练样本数据集,有望克服“区群谬误”问题,进一步改善人口密度制图精度。