语义分割中的视觉语义表示模型研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhhaibin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域,语义分割是一项十分基本和重要的任务。随着计算机硬件性能,尤其是GPU用于数值计算技术的不断进步,深度学习得以不断发展。全卷积神经网络的出现,使得基于深度学习的语义分割方法取得快速地发展,然而基于视频数据的分割方法获得了较少的关注。视频数据相比于图片数据,多了一维时间序列信息,如何更有效地利用该信息对科研人员提出了挑战。另外,对于智能决策系统来讲,预测未来的能力对于决策来讲具有现实意义。例如智能驾驶系统以及机器人巡航系统,都需要对当前的场景进行感知和决策,这其中语义分割起了很重要的作用,对于语义分割预测的研究还处于起步阶段,如何更好地建模时空关系也是大家研究的一个重点。针对语义分割问题,本文从提高当前帧的语义分割性能出发,尝试对相邻帧之间的时序和空间特征进行建模,来获取更好的分割特征。一是提出了时序建模模块,通过设计掩码以及门控激活操作对时序和空间特征进行建模。二是在解码产生分割图的过程中,通过设置依时间衰减的特征融合方案来融合历史信息,以此来获取分割时更好的特征表示。针对语义分割预测任务中的两个问题,即小物体缺失以及运动物体预测偏移现象,分别提出了不同的解决方案。首先,对于小物体缺失问题,本文提出了帧间的注意力机制,利用前一帧的上下文信息对后一帧进行语义细节补充,提高非显著物体的语义表达。其次,对于预测过程中运动物体的偏移现象,本文提出了在卷积长短期记忆网络中融入可变形卷积,增强标准卷积所缺乏的建模位置变化的能力。
其他文献
太赫兹波是指频率在0.1 THz-10 THz范围内的电磁波,介于远红外光与微波之间的电磁波谱区域。太赫兹波具有很多独特的电磁性质,如瞬态性、宽带性、低能性等。因此,太赫兹波光谱成像技术在生命科学、医学成像等领域有着极大的应用前景与应用价值。本文基于太赫兹波衰减全反射光谱成像技术,实现对不同生物材料的太赫兹光谱成像测量;基于单层和双层ATR样品模型,对胶质细胞的太赫兹波介电响应特性进行研究;开展太
近20年来,国家交通基础建设迅猛发展,全国高速公路总里程快速增长,交通设施日渐完备。其中高速公路车道线作为必不可少的交通设施之一,对于规范车辆行驶、降低事故发生率具有十分重要的作用。但随着高速公路投入使用年限增长,受各种天气的影响,加之高速公路上车流量大、车辆行驶速度较快,会导致车道线不同程度的磨损,给安全行驶造成隐患,因此定期巡检车道线状态,及时补修十分必要。现阶段国内高速公路车道线的缺损检测,
扫频光学相干层析成像技术(Swept Source-Optical Coherence Tomography,SS-OCT),利用样品组织的背向散射光与参考光之间的低相干干涉,对光谱信号进行反傅里叶变换实现图像深度信息的重构,具有微米级高分辨率、高信噪比、瞬时成像以及非接触式成像等特点,广泛应用于眼科学的临床诊断中,以实现活体眼的快速无创成像。本文探究了扫频OCT的成像原理及其在眼科临床诊疗中的应
全球疾病负担研究表明心脑血管疾病约占疾病总死亡人数的32%,是全球第一大死亡原因。血管内光学相干成像(intravascular optical coherence tomography,IVOCT)系统以其分辨率高、灵敏度高、可实现血管内成像,并能清晰显示动脉粥样硬化斑块的结构特征、组织特征、甚至细胞特征,获得了心脑血管介入医学临床上的广泛应用。但目前IVOCT还是仅能提供血管和斑块的散射强度成
现代工业中,复杂环境下的小尺寸零件的缺陷检测日益受到人们的关注,内窥镜检测作为无损检测的一个分支,可以在复杂环境下对人眼不能直接观察到的地方进行检测,在工程建筑、汽车检修、机械检修等方面均得到广泛使用。本文设计并实现了一款用于小孔径管道零件内壁检测的工业内窥镜系统,具体工作内容如下:1、分析国内外内窥镜的发展现状,确定小型工业内窥镜的设计以硬管式内窥镜为基础,使用CMOS图像传感器代替传统目镜,让
图像语义分割是指根据语义信息,对图像中每个像素点进行分类标注的技术。它是一个计算机视觉领域的基础研究课题,它对于场景理解和环境感知具有重要的意义。然而,语义分割模型的训练需要大量可靠有效的数据集,并且语义分割图像逐像素标注需要耗费大量的时间和人力。为了解决有效数据集不足和样本标注耗时耗力的问题,本文利用主动学习算法从未标注数据集中选择更有意义的样本进行标注,构造可靠有效的数据集。为了更好的实现语义
近些年来,信息作为一种重要的战略资源在新一轮信息化革命和国际竞争中的地位和作用越来越重要。但是,随之而来的信息安全问题也日益凸显。公钥密码作为广泛应用的密码体制之一,其安全性已经成为工业界和学术界研究的重点。对已有加密算法的攻击,可以帮助我们分析算法的安全性,了解已有加密算法缺陷,采取防护措施。本文针对盲化后的密码算法提出了一种水平侧信道攻击,该方法基于聚类算法,仅用单一曲线进行密钥恢复。然而单一
显微CT(Micro-Computed Tomography,Micro-CT)以其无损检测、高分辨成像、微米级测量等优点被广泛应用于微电子、材料化学、石油地质等研究领域。在显微CT进行尺寸测量时,重建图像的质量、体素大小与数量的准确是保证有效测量结果的关键。理想的系统几何位姿是显微CT成像的基础,然而仪器设备的安装定位几何参数可能存在偏差,导致重建图像质量下降。同时,显微CT系统主要硬件位于铅制
光谱成像技术能够同时获取在体组织的结构与谱域信息,具有分辨率高、成像范围广以及信息丰富等优势,在生物医学领域应用广泛。在在体组织检测及成像中,结构紧凑、成像速度快、低成本的成像系统是扩展光谱成像技术应用的关键。本文搭建了基于窄带滤光片以及光谱重构方法的多光谱成像系统,并通过蒙特卡洛模拟、仿体实验以及在体组织实验对其可行性和有效性进行了综合研究。首先,介绍了多光谱成像技术的成像原理,选取特定的窄带滤
畜禽废水已成为农村一个主要的面源污染来源,针对这种污染现状,近年来出现了许多废水处理方法。在概括分析了畜禽废水的研究现状后,提出了人工湿地处理技术。通过对人工湿地研究现状的综述,阐述了人工湿地在净化污染物方面的研究进展。并通过对人工湿地在畜禽养殖废水处理中应用的介绍,分析了人工湿地存在的优势和问题,提出了人工湿地在畜禽养殖废水处理中具有广阔的应用前景。