基于视觉转换器的伪三维残差网络图像语义分割研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:longdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机软件技术的迅速发展以及硬件技术的不断提高,图像语义分割技术正在成为机器视觉领域一个十分重要的研究热点,在计算机视觉众多研究领域中发挥着十分重要的作用。图像语义分割本质上是图像像素分割与图像内容理解的结合,其目的是给每个图像像素赋予某个特定类别的语义标签。得益于硬件技术的不断发展、计算能力的不断提升、图像数据的海量井喷,基于深度学习的图像语义分割技术已经广泛应用于影视特效、无人驾驶、智能医疗、安防监控等人工智能领域。图像语义分割效果常常受到颜色、形状、纹理、尺寸等因素的影响,进而可能影响最终的处理效果。传统的图像分割方法常常利用人工设计特征实现像素分类,此类方法不仅存在过程较为复杂、效果不甚鲁棒的问题,而且往往无法赋予每个像素一定的语义信息。由于深度学习方法利用数据训练代替人工设计实现特征表征,从而使得深度学习方法在全局特征提取和上下文信息描述方面具有明显的优势。因此,本文在现有工作的基础上,对图像语义分割开展研究,主要开展了以下几方面的工作:构建基于伪三维残差瓶颈单元的语义图像分割模型。首先,将VGG-16全连接网络替换为伪三维残差神经网络,以期获取精度更高的图像分割结果;然后,通过在跳跃连接块结构中加入1×1×1卷积层,以期进一步优化图像分割结果。构建基于视觉转换器的透明物体语义分割模型。首先,借助卷积神经网络提取图像的局部特征;然后,利用具有多注意力的视觉转换器获得图像的全局特征,更好理解图像上下文信息;最后,融合图像的局部特征和全局特征,提升语义分割效果。为了验证本文所提出网络模型的语义分割效果,在公开图数据集上进行了实验测试和性能评估,并通过与其它经典算法的对比实验,验证了本文所提模型具有良好的分割效果。实现了基于量化模型的透明物体语义分割。为验证模型的实用性和实时性,选用树莓派作为本次实验的硬件平台,同时以Tensor Flow Lite作为本次实验的软件平台。实验结果表明,本文提出的基于视觉转换器的透明物体语义分割算法可有效、实时地分割特定目标。
其他文献
建筑能耗约占一个国家能源消耗总量的30%-40%。在建筑能耗中,暖通空调系统的能耗占40%左右。虽然暖通空调系统耗能很高,但取得的用户热舒适性较低。重要原因在于暖通空调系统控制算法无法准确知晓用户的真实热舒适程度并采取有效的控制决策确保用户高热舒适性和系统低能耗。传统的热舒适模型用来预测群体热舒适程度,当应用于个体时,其准确性较低。随着物联网感知技术和机器学习技术的发展,用户热舒适建模迎来了新的发
学位
新冠肺炎疫情的传播是当前人类社会面临的重要挑战,也是现代传染病研究的热点。使用传统传染病动力学模型和地理时空特征分析开展相关研究是当前针对新冠肺炎疫情的主要方法。传染病动力学模型的参数复杂多变并且难以获取合适的参数值,地理时空特征分析的方法并没有考虑人类移动性,而人类的活动与疫情的传播息息相关。本文提出基于人群迁徙网络社区的新冠疫情分析方法。首先,利用人群迁徙数据分别构建城市级别上的人群迁徙单一网
学位
多智能体系统一致性因其在交通运输规划、机器人路径规划等领域的广泛应用,成为控制理论及应用领域学者关注的热点问题之一。目前关于多智能体系统渐近一致性、有限一致性和固定时间一致性的研究已取得非常丰硕的成果。本文在现有研究基础上,针对一阶多智能体系统的指定时间二分一致性开展了进一步的研究。开展的主要工作如下:(1)针对符号有向一阶线性多智能体系统,设计了两种基于不同事件触发机制的指定时间控制算法,以代数
学位
报纸
非线性方程组系统来源于实际应用,如信息科学、工程技术、自动化和科学计算等。非线性方程组系统大都存在多个不同于全局极小点的局部极小点,但经典的求解线性规划问题的算法并不能成功地求解非线性方程组系统。虽然现阶段有不少关于求解非线性方程组系统全局极小点的研究,其中包括:填充函数法,遗传算法等,但这些方法或者难以实现,或者需要较强的约束条件才能得到全局极小点。为了克服这些困难,本文主要采用同伦方法求解非线
学位
近年来,二维层状材料因其独特的电子性质和光学性质成为下一代纳米光电器件应用的热门材料。石墨烯由于零带隙的限制,依然在短期内无法实现大规模应用。与之不同,TMDCs包括半导体性质和金属性质的两类,具有带隙大、自旋谷极化和超导等特性,特别是单层MoS2,它是TMDCs的典型代表,最薄的直接带隙半导体。与传统的硅基半导体相比,单层MoS2薄膜被认为是下一代电子器件和集成电路的替代材料,同时也在能源催化、
学位
近年来,随着遥感技术的发展,新型卫星传感器不断涌现。不同的遥感传感器获得的遥感图像,由于传感器之间的成像机理迥异,形成的遥感图像有着各自的优劣势。为了全面了解地物目标特征及其变化,多源卫星传感器数据融合应运而生,即将不同类型传感器获取的影像数据融合的技术。其生成的融合图像可以综合利用不同卫星传感器数据的优势,以应对越来越多有着更严苛要求的遥感应用。光学时空融合和合成孔径雷达(Synthetic A
学位
<正>近日,淄博烧烤在网络走红,成为消费低迷时代的一个亮眼的网络现象。很多事情能成功,往往是天时、地利、人和的合力结果。就以天时来说,春光大好,报复性的旅游就出现了。很多城市受淄博烧烤走红的启发,也在准备出战,希望复制这种路径。比如现在很多网络信息都指向徐州,因为徐州的美食本来就很有地方特色,烧烤更有源远流长的历史。
期刊
面对与日俱增的高数据速率需求,第五代移动通信技术(5th Generation Mobile Communication Technology,5G)成为无线通信领域的前沿技术,以此作为驱动力的无线通信系统能满足人们超高信息传输速率和超大信息传输量的要求。大规模多路输入多路输出(massive Multiple-Input Multiple-Output,m MIMO)技术被引入为关键技术充分挖掘
学位
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术在基站侧部署大量天线,能显著提高系统的吞吐量,可靠性和频谱效率,被视为5G通信研究中的热点之一。为了实现这些优势,需要获取精确的信道状态信息(Channel State Information,CSI)。然而,信道估计过程中导频开销限制了大规模MIMO系统的性能。基于此,本文研究了基于低秩矩阵完备和低秩
学位