基于多模态特征融合的室内图像语义分割方法研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:boshi9529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在复杂的室内环境中,存在光线照射不均匀、物体繁多且大小不同,物体间颜色和纹理相似度高以及相互遮挡等情况,使基于彩色图像的分割方法在边界的识别和类别的划分等方面的能力表现较差,导致分割精度较低。结合彩色图像和携带空间几何信息的深度图像的语义分割方法利用物体的位置和层级信息对彩色特征进行补充,从而提升语义分割性能。但彩色图像和深度图像包含的信息具有内在的差异性,因此,探索一种高效地提取和融合多模态特征的室内语义分割方法是非常具有挑战性的。首先,提出了基于多模态特征融合的卷积神经网络(Multi-modal Feature fusion Convolutional Neural Network,MFCNN)模型进行RGB-D图像的室内场景语义分割。该模型分为编码-解码两个部分。在编码阶段,构建多模态特征编码结构,将RGB-D图像的彩色图像和深度图像作为两个独立模态进行提取特征,在RGB-D融合模态上逐层融合RGB和Depth模态特征。通过分离各模态特征的提取和融合操作,使网络获取更多的特征信息。在解码阶段,利用反卷积操作进行上采样,对RGB-D融合模态特征连续上采样数据和解码特征多倍上采样数据进行跨层级多模态连接,获得更多的上下文特征信息,利用各层级不同尺度感受域的多模态信息,增加目标识别的多尺度鲁棒性,提高模型分割精度。其次,针对MFCNN模型的语义分割图中存在类间分类错误的情况,提出了基于双注意力机制与多模态特征融合的深度神经网络(DAM-MFDNN)模型对RGB-D多模态图像特征间的关系进行深入研究。利用多模态补充注意力模块计算RGB-D图像的各通道特征间的相关性,对重要特征通道赋予较大的权值,通过加权后的多模态特征的融合对特征信息进行补充,加强特征的显著表达,获取高质量的特征信息。通过多模态全局注意力模块对深层RGB特征和Depth特征计算全局语义信息的依赖关系,加强特征对语义信息的表达能力和模型的判别能力,得到更加准确的语义分割图。最后,在NYU Depth V2和SUN RGB-D数据集上验证了上述模型的有效性,并与目前较为流行的语义分割方法进行比较,本文提出的模型具有较高的语义分割精度,在客观评价方面体现了一定的优势。
其他文献
激光视觉传感器被广泛用于焊缝跟踪,具有精度高、非接触、快速测量等优点。目前大部分视觉传感器只能用于一个平面内的焊缝跟踪,本文设计了一种三线组合结构光视觉传感器,在双线激光跟踪焊缝的基础上增加了一根横线激光,用于检测前方转弯的折角,为机器人跟踪角焊缝时提供所需的信息。本文首先介绍了机器人系统的组成,控制系统是基于PC104总线开发,用图像采集、运动控制、数据采集等板卡实现控制。设计了一个三线组合结构
与虚拟手术相关的研究从未停滞,虚拟手术系统是以医学影像为基础,通过图形学相关技术重建人体器官模型,来模拟虚拟手术环境。CT图像作为当前医学图像领域中最普遍的图像数据之一,软组织模型是仿真手术的训练对象,而穿刺软组织作为虚拟穿刺手术中的关键步骤,其效果取决于软组织的真实程度,即软组织模型的精度是虚拟穿刺手术系统能否反映出人体组织器官的真实力学行为的决定因素。本文以构建接近真实穿刺实验的针刺肝脏有限元
在如今图像识别应用广泛的社会里,由于与人的可分离性,传统的身份信息核验方法如IC卡等,容易出现盗用或仿造等现象,因此在火车站、飞机场等城市之间重要的交通枢纽部分,以人证合一的技术取代了传统核验方法。然而,在日常生活中的一些人流量大又需要身份验证的场所,例如在考场的场景之中,往往还依靠着人力来逐一进行检测,这不光加大了监考人员的劳动强度,还难免会出现场外拥堵等现象和人为上的失误,继而导致出现影响考试
在大数据时代,信息呈现爆炸增长状态,信息的飞速增长给当今信息化社会带来了很大的挑战。如何准确分辨出所需要的信息数据以及如何对有用的信息加以有效利用,这已经成为信息化社会急需解决的问题之一。针对该类问题,关键词自动抽取技术应时而生,其利用关键词来反映文本的主要信息,高效地解决了难以抽取所需要的信息数据这一难题。关键词抽取一直是自然语言处理(NLP)中的重要领域,其在信息检索、文本分类、问答系统等领域
陶行知先生曾经这样说过:“教育人和种花木一样,首先要认识花木的特点,区别不同情况,给以施肥、浇水和培养教育。”“双减”政策实施后,多数学生参加课后服务,教师辅导的学生变得多了。对同一份作业,学习好的学生或许30分钟就能完成,但学困生可能需要90分钟,甚至更长时间,而平均是60分钟,但能这样平均吗?当然不能,在作业完成的时长中我们不能因为平均数忽视学生间的差异。所以,课后服务辅导如果没有做到因
期刊
2A12铝合金是广泛应用的航空材料,但由于长时间暴露在大气环境中,腐蚀问题不可避免,因此,机体腐蚀已经成为威胁飞机安全的重要问题之一。本文根据2A12铝合金大气腐蚀的主要影响因素,分析现有的金属材料大气腐蚀仿真研究的方法,研究了2A12在海洋大气条件下腐蚀过程。采用有限元仿真软件COMSOL Multiphysics模拟了2A12在大气条件下的第二相腐蚀、钝化膜缺陷腐蚀和与AISI 4030钢直接
绿色,是发展的目标,是前进的方向。实现碳达峰、碳中和,是贯彻新发展理念,着力解决资源环境约束突出问题、实现中华民族永续发展的必然选择,是构建人类命运共同体的庄严承诺。“双碳”目标的提出,为铝行业重新定义了绿色低碳转型的目标路径与可持续发展的使命愿景。作为铝行业的绿色示范企业,云铝股份在中铝集团的坚强领导下,锚定“双碳”目标,矢志“绿色”初心,坚决扛起绿色铝发展大旗,坚持走绿色、低碳、可持续发
期刊
心功能不全会引起患者心悸怔忡、呼吸困难等现象,重者会出现双下肢肿胀、肺淤血,甚至导致心肌梗死,严重的影响了患者的日常生活。随着人口老龄化进程加快、各类心血管病发病率的上升,老年心功能不全(心衰)病人甚至是青年心衰患者人数逐年增加。目前临床上心功能不全的检测方法都价格高昂以及过程复杂,存在诸多局限性或不足。如何用简便快捷的方法和有效的量化指标实现心功能不全疾病的早期诊断来降低误诊和漏诊率,从而提高诊
随着5G NR技术标准协议的不断制定,5G移动通信网络已开始逐步建设,5G时代的到来,带给我们更高的网络速率体验、更便捷的生活体验。5G NR中的物理广播信道PBCH,作用是广播移动用户终端接入无线通信系统所必需的关键系统信息MIB,是十分重要的下行信道之一。和4G一样,5G同样是基于OFDM系统的移动通信网络,在面对各类干扰信号等日益复杂的通信环境时,会影响移动通信系统的正常运行。为了提高以OF
移动通信的高速发展以及物联网设备的爆炸性增长导致了严重的频谱短缺问题,同时由于增强现实、智能家居、智能交通、智慧城市等需要高传输速率的新兴网络结构的涌现,移动用户的通信服务质量越来越得不到满足。认知无人机(Unmanned Aerial Vehicle,UAV)网络可以通过频谱共享方式提高频谱效率,同时可以利用无人机可控的机动性和飞行灵活性方面的优势,提升用户信息的传输速率。然而,由于无线通信的固