基于半监督学习的语义分割算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:dxcnet2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉是当今人工智能领域中极为热门的研究方向,而静态图像和动态视频作为视觉媒介中最为常见且重要的两种形式,对其包含的语义类别进行正确有效地分割,既是后续目标跟踪、行人车辆再识别等科研方向的基础,也是无人机定位、自动驾驶等实际应用的基石。
  语义分割旨在对给定的静态图像或者动态视频序列每一帧图像中的像素点进行分类标注,本文在对现有针对图像及视频的语义分割方法进行调研及复现的基础上,对现有开源方法中存在的不足及可改进方向进行了总结与分析。现有的图像语义分割模型大多依然依赖于人工设计的像素级标注,同时对于部分小样本类别难以正确分割。而现有的视频语义分割模型,由于视频的时间连续性和物体运动性,往往很难同时保证分割方法的精准度和实时性,因而难以被广泛应用。针对以上问题,本文分别提出一种图像语义分割模型和一种视频语义分割模型。
  基于迁移学习和生成对抗网络的思想,本文提出了一种基于类别信息和半监督学习的跨数据域图像语义分割模型,通过改变传统基于双线性插值的上采样方法以及此阶段损失函数的设计,提出一种新的基于监督学习的源域数据训练及分割方法,同时结合类别分布信息,利用生成对抗网络的思想进行跨域分割,实现了对无标注目标域数据的有效分割。在分别以GTA5和SYNTHIA虚拟数据集为源域数据,以Cityscapes为目标域数据的实验中,本文方法的分割精准度可达43.7%和41.6%,与先前方法的结果均值相比,结果提高约6个百分点。
  在对图像进行有效处理基础上,结合光流场可以表征视频序列中物体运动性的特点,本文提出了一种融合类别特征信息与光流运动变换的双流半监督视频语义分割方法。通过结合视频帧深层特征的相似性和浅层特征的差异性,利用深度神经网络对视频帧图像进行特征提取,并结合类别信息和先前帧进行预分割,又融合光流对物体运动状态的反映,在保证算法实时性的基础上,对视频中显著类别或全景语义的分割结果精准度进行了提升。本文分割方法在DAVIS2017和YoutubeVOS视频对象分割数据集的平均精准度可达72.1%和68.3%,对于视频全景分割数据集CamVid和Cityscapes的平均精准度可达48.6%和53.2%。
其他文献
旋翼飞行器作为无人机的一种常见类型,具有结构简单、机动性强、操作简便和效费比高等诸多优点,具备垂直起降、自由悬停等适应复杂环境的能力,具有广阔的发展前景。因此,被广泛用于农业植保、工业巡检、搜索营救、情报侦察等民用场合和军用领域。旋翼飞行器是非线性、多变量和强耦合于一体的欠驱动系统,而其内部系统模型的不确定性和外部未知干扰增加了旋翼飞行器控制系统的设计难度。姿态控制作为旋翼飞行器控制系统的关键技术,姿态控制方法的研究变得十分必要。本文研究工作如下:
  首先,设计两旋翼飞行器测试平台,其包含两旋翼飞
近年来,计算机和移动互联网技术的快速发展极大的改变了人们获取信息的方式,在线社交网络平台的迅速发展使得信息传播变得更加便捷。这也为谣言的传播提供了途径,严重时可能造成政治经济上的危害。本文基于真假消息传播模型,从网络的过滤虚假消息能力出发,研究了真假消息传播过程中动态演化过程,并提出了基于动态规划的真假信息传播能力的计算方法。本文的主要研究内容如下:
  1.基于自学习机制的社会网络信息扩散模型:本研究针对社会网络中的个体具有从历史信息中学习的能力,在此基础上提出了一种新的社会网络信息扩散模型,该模
蛋白质的生物学功能取决于蛋白质的三维空间结构,获取蛋白质三维空间结构对于人类认识自身和疾病有着非常重要的意义。然而实验方法测定蛋白质结构不仅代价大,而且周期长。因此从蛋白质序列出发,直接预测蛋白质三维结构已成为目前生物信息学领域中的热点研究问题之一。
  近年来,蛋白质结构从头预测方法取得了较大的发展和突破,但是蛋白质构象空间的高维复杂性以及能量模型不精确仍然是蛋白质结构预测研究的难点。利用先验知识辅助蛋白质高维构象空间优化,对于提升蛋白质结构预测精度而言具有重要的作用;另外,多模态优化方法可以缓解
股票市场由于其在国家以及人民群众中的特殊地位,很早就是人们想要研究的对象。而股票市场的内在波动形式与变化情况的预测一直是相关研究人员的重点研究内容。但是股票市场具有非线性、高噪声,多扰动的特点,想要对股票市场的未来运动轨迹做出预测并非易事。近年来随着信息传播速度的加快,人们获取信息的速度与途径相比以往都有了极大的提升。而伴随着着机器学习技术和相关统计学习技术、大数据技术的发展,研究者对股票特征的刻画也更加全面。由于对股票市场的认识大多是基于股票时序数据的股票多因子研究,目前随着计算机算力的提升,对大规模的
策划人语:  今年时值建党百年,全党上下深入学习宣传贯彻习近平总书记在庆祝中国共产党成立100周年大会上的重要讲话精神。当今世界正处于百年未有之大变局,意识形态领域的斗争日趋尖锐,形势日益复杂。在此背景下,如何把握高校宣传思想工作的新形势、新要求,凝聚政治认同,着力化解风险,加强思想引领,开创高校宣传思想工作新局面,全力维护高校政治安全和校园稳定,是摆在全省高校党委宣传部门面前的重大课題。  为进
期刊
近年来,基于模式识别的智能仿生技术取得了长足的发展,智能仿生假肢的功能、性能、可穿戴性及智能化程度越来越高,已成为国内外学者的研究热点。对智能仿生系统开展研究不仅具有重要的学术意义,而且具有很高的社会与经济价值。
  表面肌电信号(surface Electromyography,sEMG)作为一种生物电信号,能够反映功能性肌肉收缩的电活动,具有提取方便、无创伤等特点。然而由于肌电信号本身固有的缺陷,导致残肢接口信息源不足,难以同时呈现同一肌肉收缩的电生理和形态学变化信息,A型超声传感(A-mode
文化演出日益成为现代人们丰富精神生活的重要形式,应用信息控制技术丰富舞台装置功能已越来越受到文化展演行业的关注,可作为演出载体的自主移动车台与舞台各系统的融合集控、多移动车台演出编队控制成为现代文化演出服务领域的研究热点。
  在现实演出中,自主移动车台融合舞台集控网下轨迹跟踪失误、跟踪灯光视频动画不同步,以及本体故障和通信干扰时多移动车台群控演出失败时有发生。现有方法通常采用人工干预或者增加硬件成本手段处理,大大限制了自主移动车台在各类演出场景中的灵活和安全应用。因此开展围绕针对演出场景干扰和系统
一、新闻发布工作实践  分享嘉宾:杨晓谜(河南教育新闻中心副主任、教育时报副总编辑)  分享要点:一是热点问题的处理。二是突发新闻事件的处理,包括宏观之势、中观之道、微观之术三个方面。三是从前期筹备,到发言人和主持人的话术、着装等方面,全方位为学员讲解如何准备一场新闻发布会。  二、从微信新媒体运营谈起:如何让师生凝神聚气  分享嘉宾:黄发强(河南教育新闻中心主任助理)  分享要点:一是传播、受众
期刊
真实世界的网络表现出突出的层次结构和模块结构,并以各种子图作为构建块。现有的大多数研究通常将不同的子图提取出来作为模体,并简单地使用它们在网络中出现的频次来描述底层网络。虽然这些统计数据可以用来描述一个网络模型,甚至可以用来设计一些网络算法,但是这些研究不足以发挥子图的关键性作用。本文进一步探讨了子图在网络算法中的应用以及模型的性能。本研究就子图在网络分析研究中的可扩展性做了较为深入的研究,并分别从以下三个方面依次展开,提出了一些子图网络模型及其在网络分析应用中的算法:
  (1)提出一种新的子图网
现实世界中的复杂系统可以用网络来表示和分析。在过去的几十年里,网络科学已经成为一个重要的跨领域学科,旨在使用网络和图作为工具来描述复杂系统的结构并解决实际中的问题,包括社交网络、引文网络、蛋白质网络和交通网络等。近年来,人们提出了许多图表示学习的方法,极大地促进了机器学习方法在图数据挖掘中的应用。图表示学习解决了原始网络数据的高维性和稀疏性问题,在机器学习和网络科学之间架起了一座桥梁,使得许多机器学习算法可以应用到网络分析中。与此同时,相关算法安全问题也吸引了大量研究者的目光。本文针对图表示学习的算法安全