基于多特征图融合的建筑立面窗户检测方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:peper127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建筑立面的语义分析是计算机视觉和图形学应用中的重要问题,对于三维城市建模、场景可视化、城市场景理解等任务是必不可少的一环。窗户作为建筑立面中最为主要的组成部分,从立面中检测窗户,是立面分析任务中最为主要的组成部分之一。建筑立面窗户检测的目标是,给定一张彩色建筑立面图像,从中定位窗户的位置。窗户位置可以由其关键点、包围盒、语义像素区域等方式所描述。由于立面与窗户的多样性,本文采用更为通用、鲁棒的语义关键点来描述所检测的窗户区域。
  本文研究提出了一种基于多特征图融合以检测建筑立面窗户的方法。特征图包括关键点概率图,关键点间关系图以及窗户几何中心点的概率分布图。通过网络端到端地学习并预测多特征图,将各预测处理模块统一到了一个整体框架内。首先,通过结合注意力机制,提升概率图预测的质量,从中提取更高精度的窗户关键点定位。接着,引入关联嵌入特征概念,利用标签图编码窗户关键点之间的关系,用以聚类同一窗户的关键点。同时该编码方式能够更好地应对高密度立面。最后构造了中心点验证模块,进一步提升预测结果的准确性。本文未利用任何立面先验知识或对立面作任何几何假设,对于立面图像也几乎不作特殊要求。同时方法通过将窗户抽象为多边形来描述它,因此对于复杂的、不规则的建筑立面更为鲁棒,更有利于检测窗户区域。由于缺少现成的标注数据集以供训练,收集并标注了建筑立面图像,构建了一个含有超过3000份标注样本的、具有丰富多样性的建筑立面数据集。基于此数据集,进行了定量和定性的对比实验。实验结果证明了本文方法的准确性与鲁棒性,且在复杂多变的建筑立面图像上表现出色。最后,基于本文的建筑立面窗户检测系统,展示了相关的图形图像应用。
其他文献
摘要:我国的法律行业经过了几十年的发展,在经营管理体系上获得了长足的进展;律师职业也整体面貌一新,取得一定的美誉。然而,我国的法律行业在经营管理系统,尤其在绩效评价系统方面还存在欠缺,从而导致现有律师事务所存在资产小、职员分散、整体权力低、效率低等问题。为此,本文提出将平衡记分卡引入律师事务所绩效评价体系中,以增强律师事务所发展潜力,提高自身的风险承受实力。  关键词:平衡计分卡;绩效考核;律师 
期刊
摘要:对于汽车行业竞争日益激烈的今天,客户对感观质量需求越來越高,汽车的装配质量会影响防水,风噪和外观等性能,影响客户的直接感观体验,故汽车各部件的装配质量也随之要求越来越高,而顶盖天窗装配涉及到钣金件冲压,焊接,总装件装配,涉及到对个零件尺寸搭配,结构复杂,工艺性差,尺寸波动极大,容易在生产产生装配质量问题,本文结合实际生产,针对工装和工艺方面作为突破口,提升天窗装配尺寸的稳定性。  关键词:顶
期刊
随着电子交易系统的发展,全球主要证券交易所普遍采用订单驱动的交易机制,每个交易日会产生数十亿的高频限价订单簿记录。限价订单簿中间价格的预测一直是高频交易领域的研究热点,研究成果对于做市商、交易者和监管者有重要意义和实际价值。该领域的研究主要以金融学的研究思想为主,然而考虑到如此庞大的数据量,很自然地需要采用数据驱动的方法对这一问题进行研究。当前的研究模型普遍依赖于人工设计的输入特征,输入特征的质量直接决定了模型的表现。考虑到交易市场瞬息万变,即使当前有效的特征在未来也可能失效。
  针对上述问题,本
人工智能技术的再度兴起,促进了诸如增强现实、移动式机器人、无人机、自动驾驶等行业和领域的快速发展,而传统的同时定位与地图构建(Simultaneous Localization andMapping,SLAM)技术也随之有了更广阔的应用前景和更多的研究契机。自动驾驶作为一个十分热门的研究方向,对于定位和环境感知的需求十分强烈,不仅需要能够精确、鲁棒地估计车辆自身在环境中的位置和姿态,同时还要密切关注环境中有什么物体、分别处于什么状态,这样才能确保车辆能够做出安全、正确的决策。
  本学位论文针对这两
摘要:随着时代的发展和进步,我国的国际地位不断上升,中餐文化近年来已经得到了国际的认可和发展,在国际上的地位也日益提高。我国作为中式烹调的发源地,掌握着中式烹饪的内涵。在新的文化背景之下,人们对于食品的追求不再仅仅局限于味觉方面,更重要的是视觉方面的菜品的色彩和造型艺术等,这也为中式烹调的菜品带来了新的挑战和机会。为了使得中式烹调的菜品能够更加满足人们对于食物品质的追求,需要重视菜品色彩的搭配和造
期刊
互联网与物联网技术的发展改变了链接方式,服务化成为各行业的发展趋势,也成为企业业务开放的重要模式,IBM更是提出了API经济的战略,这一战略模式要求把硬件、软件、数据、人力等资源封装成Web服务,以API的方式供第三方使用,从而支撑生态体系的孵化。Web应用是一种重要的软件与数据资源,随着互联网的快速发展和普遍应用,Web应用数据和资源的数量出现了爆发式的增长。面向Web应用资源,研究智能化服务封装方法,实现以服务请求的方式执行Web数据的采集和处理任务,将会简化用户的工作量、促进产业生态的孵化。
近些年来,随着移动设备的普及和移动通讯技术的大力发展,服务的使用场景发生了巨大的变化,越来越多的服务开始以移动设备为载体。这时,移动网络质量的不稳定性、移动用户位置的变动性、以及移动设备资源的局限性等因素都给服务的高效运行带来了挑战。基于此,研究者提出了“移动服务计算”这一概念,并在服务计算研究的基础上结合对移动场景所造成的影响的分析提出了各种补充方案,从一定程度上缓解了传统服务计算技术的缺陷。
  然而变化的并非只有使用场景,随着人们对“现实世界信息化”的需求的逐渐强烈,服务的复杂性也急剧增长。在
目标检测是计算机视觉领域的热门方向之一,具有广泛的应用场景。随着移动嵌入式设备性能的不断提升,将深度学习方法应用其上的需求日益增加,因此针对移动端目标检测算法的研究不断深入。本文针对PeleeNet的缺点,提出了一种轻量级卷积神经网络模型CSCNet(Context Selective Convolution Network),并结合移动终端电表部件检测的应用场景,开发一款移动终端应用。
  在模型检测精度方面,CSCNet一方面通过全局上下文信息选择性卷积模块结合通道间依赖关系和上下文信息,增强特
随着信息的爆炸式增长,从海量数据中提取出关键信息已经成为当下研究的热点。作为信息抽取中重要的子任务,关系抽取能够帮助分类文本实体之间的关系,服务于知识图谱构建、自动问答、知识推理等多个任务上,受到学术界和工业届的广泛关注。
  传统的关系抽取方式主要基于模板或者特征工程,非常耗时耗力。随着深度学习的蓬勃发展,基于深度学习模型在大部分领域已经取得了超越传统抽取方法的良好效果,也是关系抽取目前的主流做法。但是基于深度学习的方法通常都需要构建大量均匀分布的训练数据,这样的条件在实际场中很难满足。
 
跨域图像转换的应用领域非常广泛,计算机视觉和计算机图形学中的许多问题都可以归结为跨域图像转换问题,该技术是计算机视觉领域的热点研究方向之一。目前基于卷积神经网络的深度学习方法被广泛应用于跨域图像转换中,大大提升了转换效果,但是这些方法还存在以下问题:生成图像模糊、跨域转换效果不理想、难以学习不同图像域的本质规律、转换受图像背景的影响较大等问题,本文针对上述问题展开研究,具体工作如下:
  (1)提出了基于自交叉自编码器的跨域图像转换算法:该算法将来自不同领域的图像统一处理,简化生成器结构,减少参数数