基于随机森林的城市地标提取

来源 :武汉大学 | 被引量 : 0次 | 上传用户:lin840827247
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市地标是在结构、认知或视觉上比周围其他对象显著的空间对象,作为反映城市空间布局特征的重要元素,城市地标在空间认知和寻路导航等方面具有重要作用。目前地标通常由人工提取方式获得,这种方式耗时且繁琐,因此越来越多的学者开始研究城市地标的自动提取模型,但是现有的地标提取模型各有不足,尚不能满足生产应用的需求。本文引入了随机森林模型,实现从基础地理信息数据库中自动提取城市地标。本文重点解决数据集中地标和非地标类不平衡对模型分类精度的影响,分别从数据层面和算法层面进行改进,提高地标类样本的识别率。本文以涵盖城市所有POI对象的基础地理信息库作为数据源,结合社会感知数据,利用GIS空间分析技术,从结构、认知和感知三方面提取了15个影响POI显著性的指标,构建初始特征工程。在数据层面上,针对POI数据集类不平衡的特点,采用随机上采样、SMOTE和ADASYN三个过采样方法进行数据均衡化处理,针对高维特征的冗余问题,根据特征重要性进行特征空间的优化。实验结果表明基于数据平衡的随机森林模型在POI数据集上表现良好,召回率超过95%,AUC指标超过90%,其中随机上采样方法获得的类平衡数据集在地标提取模型中效果最好。此外,通过对比实验获得了用于地标提取的最优特征子集,证明认知和感知特征的重要性,在实际应用中有助于降低数据的收集难度。在算法层面上,本文提出基于代价敏感的随机森林算法,通过类分布确定各类别样本的误分类代价,根据地标层级为每个地标类样本设置代价权重,并在投票阶段利用AUC值为每棵树赋予投票权重。实验结果表明代价敏感的随机森林模型具有良好的分类精度,召回率超过95%,AUC指标超过90%,并且该模型同样适用于小型训练样本集,可以减少人工标记的成本。
其他文献
在中国城镇化加速发展进程中,城市人口不断增多,居民生活水平不断提升,城市交通系统面临的压力也越来愈大。飞速增长的机动车保有量和出行需求已经远超出过去交通基础设施的设计承载能力的范围,城市运行节奏受交通影响变慢,出行效率降低,交通事故频发,污染物排放等诸多不利影响导致了对改善交通拥堵常发的现状,增强道路通行能力,提高城市道路运输效率的迫切需求。智能交通系统(ITS)综合多种先进技术,能提供实时交通数
复合梁结构广泛应用于桥梁、建筑及航空等工程领域。在服役过程中,该类结构往往涉及屈曲失稳、突跳等非线性宏观尺度力学行为,并且其宏观结构尺度的力学行为与微观材料尺度的应力状态紧密相关、交互影响。现有的多尺度均匀化模型可模拟宏观结构、微观材料的力学状态并实时相互传递应力、应变等关键力学信息,但难以兼顾计算精度与效率。为此,本论文旨在综合运用多尺度计算均匀化方法、Carrera统一模型理论及数值渐近法,开
研究背景精子相关抗原9(sperm associated antigen 9,Spag9)也被称作c-Jun氨基末端激酶相关亮氨酸拉链蛋白(c-Jun NH2-terminal kinase-associated leucine zipper protein,JLP),是c-Jun氨基末端激酶信号通路相关蛋白(c-Jun NH2-terminal kinase-associated interac
肿瘤内部细胞缺氧的特点明显的抑制了放疗和化疗的治疗效果,利用纳米领域的新技术,设计和建造具有缺氧响应的运载体,同时运载化疗药物和放疗增敏剂,以提高对肿瘤的治疗效果。本研究中,我们使用EDC化学和分步合成法制备了尺寸为245nm的MGO/FU-MI纳米复合材料,并使用透射电子显微镜(TEM),动态光散射(DLS)来表征其形貌和尺寸,用光电子能谱(XPS)和电子能谱(EDS)探究其化学组成,用傅里叶红
电离层是高空大气层的重要组成部分,不仅保护着地球免受太阳紫外辐射与宇宙高能粒子的直接作用,也影响着无线电波的传播,与人类的生产生活息息相关。同时,电离层也是空间大气科学的重要研究课题,监测和研究电离层可以提高人类对电离层的形成机制的认识,掌握电离层的时空变化规律。传统大气探测手段,如无线电探空仪、气象卫星等因观测成本高,难以实现大范围、连续观测。近年来,随着以北斗、GPS、GLONASS、Gali
机器人广泛应用于人们的生产生活中,将人们从单调重复性的工作中解放出来,大大提高了生产效率和质量。然而,现阶段的机器人灵巧操作水平和智能决策能力仍远低于人类,仅能应用于结构化环境下重复性的任务操作。针对动态非结构化环境下机器人的操作,难以设计具有高适应性和稳定性的运动规划算法。针对复杂接触环境下的任务操作,其位置和力的规划与控制仍需针对特定的任务进行调试,难以推广应用于不同场景。因此,本文提出基于模
第一部分下调Nkx2.5重编程乳鼠心肌细胞为起搏样细胞目的:探讨腺病毒介导shRNA下调Nkx2.5是否可将乳鼠心肌细胞重编程为起搏样细胞。方法:采用胰酶和Ⅱ型胶原酶混合消化法分离1~3天的新生雄性SD乳鼠心肌细胞,随机分为对照组和实验组,实验组转染携带靶向Nkx2.5的RNA干扰序列(短发夹RNA,shRNA)和绿色荧光蛋白(GFP)的腺病毒Ad-Nkx2.5-shRNA-GFP,对照组转染等量
肝脏具有强大的合成、分泌、解毒等特异功能,是人体重要的器官。我国肝衰竭的死亡率极高,目前治疗肝衰竭的有效方法是为肝衰竭患者提供一个在体外进行肝功能支持的生物人工肝装置。本课题旨在研究生物人工肝中肝细胞培养所需的微载体制备工艺,制备出性能良好的微载体,为临床上肝衰竭治疗奠定基础。本文第二章采用滴加法,以海藻酸钠为基料,氯化钙溶液为成球剂及交联剂制备海藻酸钠微载体。采用控制变量法,逐一探讨了海藻酸钠浓
马铃薯是世界上重要的农业作物。植物表现出不同颜色的原因,一直是植物科学领域的研究重点。花青素等次级代谢产物的合成与积累是使植物展现不同颜色的重要原因。目前已对花青素合成调控通路,以及马铃薯块茎中的花青素合成机制进行了深入研究。但是,就马铃薯这种收获地下块茎部分的农作物而言,对于其感受光信号,从而进行花青素合成的主要器官马铃薯叶片中的花青素合成与调控机研究极少。此外,在马铃薯中是否存在转录本融合等其
近年来,随着卫星和无人机技术的不断发展,遥感影像成为了全球和区域范围内对地观测与分析的主要数据源。对包含大量光谱、纹理以及上下文等细节信息的高分辨率遥感影像进行解译,已经成为了地表覆盖分类等空间地理信息数据智能分析的主流方法。目前,在地表覆盖分类数据的实际生产过程中,广泛采用的依然是基于人工的遥感影像目视解译方法,耗时耗力、效率低下。因此,针对地表覆盖分类任务的特点,研究高分辨率遥感影像自动分类方