基于卷积神经网络与3D几何语义的室内场景理解研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:zqlyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景理解是计算机视觉方向的重要研究课题之一,在很多领域得到了广泛的应用,主要包括移动机器人、图像信息检索、智能监控、智能家居等,有十分重要的研究意义以及应用价值。而相较于室外场景,室内场景因其复杂的结构和种类繁多的内部物品等问题,使得研究工作相对进展较慢,且更具挑战性。本文针对室内场景,从场景类别、目标检测以及空间布局估计三个方面对图像场景进行深入理解,提出了对三项工作进行有机结合的方法,利用彼此间的相互作用,而不是单纯地分别进行三个独立工作,并且进行了大量的实验,与众多方法进行了对比分析,结果证明了本文方法的有效性。本文的主要研究工作如下:(1)基于卷积神经网络,提出了结合语义上下文信息的场景分类方法。对于场景级别的任务,场景复杂多样,需要大量的训练数据。而利用图像的语义上下文信息,即特定场景与目标总是同时出现的,将其转化为目标级别的任务,可以降低对海量训练数据的依赖。将卷积神经网络提取的特征取代传统的人工特征,与语义特征相融合,实现场景的分类。实验结果表明,该分类方法在较小的训练集上仍有很好的表现。(2)在传统的基于几何上下文的布局估计方法上,结合了信息边缘。将由全卷积神经网络得到的信息边缘作为先验条件,对于场景布局精细化划分,基于信息边缘,减少了对通过采样频率来提高采样精度的依赖,避免了“杂乱”边缘的影响,在几何上下文避免遮挡问题的基础上,提高了布局估计的准确率;同时减少了对候选项进行得分排序的工作量。(3)除了利用上述2D空间中的信息,还通过建立3D空间结构模型,更全面地利用图像场景中存在的几何及语义关系,减少了遮挡及视角变化等问题的影响,有效提高了目标检测、布局评估计等的场景理解效果。本文将语义上下文、几何上下文和3D空间几何结构模型融入场景理解。实验结果表明,本文提出的方法在场景分类、目标检测、布局估计三个方面的性能都得到了有效的提高。
其他文献
全球领先的数字无线技术独立提供商TTPCom有限公司日前宣布,为更好地服务于中国客户,满足中国市场发展状况的需求,将要加大对华投入,扩大中国团队的整体规模和技术实力。第一步就
本文对基于微信开发的聊天机器人进行相关研究,尝试建立癌症患者随访和居家康复护理指导的数据库,并将数据库与微信聊天机器人相结合,将微信聊天机器人应用于癌症患者随访中,
9月15日统计报告显示,全球今年7月芯片设备销售较去年同期减少20.0%。
本文设计了一种Colpitts型LC振荡器,采用差分结构,具有集成度高、噪声性能良好的优点。该设计基于0.8um BiCMOS工艺,实现了中心频率为433MHz的Colpitts型差分压控振荡器(VCO)。电
本文提出了一种采用电流传送器CCⅡ-构成的电压模式三输入、单输出多功能二阶滤波器,该滤波器权用一个CCⅡ-,二个电阻和二个电容。通过选择合适的输入信号,可在输出端得到低通、高通、
目的对脑卒中偏瘫患者的康复护理措施进行探讨与分析。方法选择100例2012年1月~2013年6月我院收治的脑卒中偏瘫患者作为研究对象,对其康复护理方法进行分析。结果 共有75例
目的:西安是中国的一所内陆城市,人们特别是成年人思想观念相对保守,而信息时代让这个城市中的青少年与外部世界有了更多的接触,他们对世界和人生的理解与成年人之间产生巨大
叙事策略的运用可以改变读者对文学作品中人物的解读角度。该文在挖掘《麦克白》剧中作者所运用的叙事策略的基础上,分析了当代读者对麦克白产生同情的原因。
在媒介控制中,标本的制作、保存和展示是重要内容。蚊类等昆虫标本一般都安置在一个标本管中保存和展示。 原标本管虽然不错,但缺陷亦多:①顶部塞满樟脑、棉花等物阻挡视线,无法
韦华《湖南民性的特点及其在抗战期中的重要性》,原刊于《孤岛》1938年第2卷第8期。韦华,生平不详。《孤岛》,周刊,1938年3月1日在上海创刊,上海孤岛编辑社编辑出版,是共产党