面向非均衡数据的语义分割研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:wxc13439460105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割作为计算机视觉领域的热门研究课题,目标是对图像中的每个像素点进行正确分类。然而,现有的分割数据普遍存在像素分布不平衡的问题,即类别间的像素分布呈现“长拖尾”现象。这将导致训练模型仅在极个别样本集中的类别上表现突出,而大多数类别性能欠佳,整体精度受限,严重阻碍了多分类分割的应用化进程。本文首先针对普通场景语义分割中的像素分布不均问题开展研究,提出了一种基于数据层面和算法层面的非均衡数据分割方法。接着根据航拍场景任务的特殊性,完成非均衡数据分割算法的优化与迁移。具体内容包括:(1)提出了多分类Soft IoU(Intersection over Union,IoU)均衡损失函数。在普通场景任务中,借鉴IoU的工作原理,构造其连续域的可导近似替代Soft IoU指标。在此基础上,利用Soft IoU指导完成多分类Soft IoU均衡损失函数的设计。进一步地,提出了Balance-Batch均衡训练策略。结合mini-batch的思想,深入研究批次数据分布对模型精度的影响。通过规范批次内的数据类别,以所设计的数据增强和网络结构为基础,达到像素均衡的目的。(2)针对航拍场景任务的特点,提出了多源学习均衡算法。结合Balance-Batch均衡训练策略,利用多个源域在目标域上进行冻层训练,完成单源学习模型迁移。通过基于回归网络的最佳融合算法和基于图片级别的融合算法,差异化融合单源学习模型,实现针对航拍场景任务的算法优化与迁移。本文工作的创新点主要包括:(1)在普通场景中,提出多分类Soft IoU均衡损失函数,并结合Balance-Batch均衡训练策略,解决了数据失衡带来的不稳定问题,提升了3.755%的m IoU(Mean Intersection over Union,m IoU);(2)在航拍场景中,在目标域上迁移不同源域的信息,实现了多源信息的互补,分别提升了5.041%、2.665%和5.197%的m IoU;(3)在航拍场景中,设计结合最优权重和最优预测的多模型融合策略,保证了模型融合的有效性,分别获得了8.587%和10.125%的m IoU提升。综上所述,本文设计的面向非均衡数据的语义分割方法,综合数据和算法两个维度,在普通场景任务上提出了具体解决方案,并在航拍场景上完成了算法的优化与迁移。该系统突破了现有方案只从数据层面进行优化的局限性,为其它应用领域的非均衡数据研究奠定了基础。
其他文献
移动电子产品和电动汽车等领域的高速发展对锂离子电池的能量密度提出了更高的要求。然而,目前商用锂离子电池的能量密度受限于石墨负极低的比容量而发展缓慢。锂金属因具有极高的理论比容量(3860 m Ah g-1)和最低的还原电位(-3.04V vs.标准氢电极)被视为未来的“圣杯”电极。但锂金属本身存在体积变化、枝晶生长和副反应等固有问题而极大阻碍了其商业进程。在众多改进方案中,设计均匀的亲锂框架来负载
学位
凭借稀土离子丰富的能级结构和能级寿命长等特性,稀土掺杂上转换发光材料得到了广泛的应用,例如在生物医疗、3D显示、温度测量、太阳能电池等众多领域都发挥着不可或缺的作用。特别地,在生物医学领域应用时使用位于生物组织透射窗口的近红外光源,不仅可以提高探测组织的深度、提高信噪比,还可以防止短波激发对生物组织造成损伤,因此稀土掺杂上转换发光材料在光动力学疗法、生物成像等领域具有较大的应用价值。但是由于稀土离
学位
量子点发光二极管(Quantum Dot Light Emitting Diode,QLED)因其自身优异特性而备受关注,如色域高、可柔性化以及简便的溶液化制作方式等。但目前QLED器件实用化仍受到一些制约,如发光性能及寿命还不能满足商业化应用需求。其主要两个方面原因为电荷的传输不平衡及界面缺陷态造成的激子猝灭。本论文瞄准高性能QLED器件,主要通过采用平衡电荷注入及钝化缺陷两种方式共同作用的手段
学位
人工突触是构建神经形态计算系统的重要器件。为了实现高阶仿生性能,提高器件信息处理效率,有必要开发直接响应光信号的人工突触器件。本文利用光吸收系数大且光谱响应范围广的CZTSSe制备光电突触,以期拓宽人工突触的光谱响应范围。为此,本文研究了不同制备参数下的栅氧化层材料Hf Ox与光电材料CZTSSe的特性,并优化工艺参数以提升材料性能;利用Hf Ox和CZTSSe材料制备了薄膜晶体管型光电突触器件,
学位
高k氧化物作为一种性能优良的新型介电层材料,在电子器件中应用广泛。氧化铝(Al2O3)薄膜和二氧化铪(Hf O2)薄膜具有很高的k值、较好的化学稳定性、热稳定性以及较大的禁带宽度,是十分有潜力的高k材料。制备这两种薄膜的方法,目前主要是原子层沉积和化学气相沉积等工艺,这些方法生长的薄膜质量较高,但是需要真空环境和昂贵的设备。本文使用化学液相沉积法制备氧化物薄膜,化学液相沉积法是一种工艺简单、成本低
学位
神经形态计算可以实现计算中心和存储中心一体化,能够提供一种速度快、效率高、能耗低的并行数据处理方式,有望成为下一代计算机体系。研发能够模拟生物突触学习与记忆行为的人工突触器件是实现神经形态计算的关键。忆阻器的阻值受到流经的历史电流所控制,这一特性与生物突触可塑性相似,因此被广泛应用于人工突触器件制备和神经形态计算研究当中。到目前为止已有多种材料体系被应用于人工突触器件的开发,比如氧化物、二维材料、
学位
柔性铜锌锡硫硒(CZTSSe)太阳能电池因可弯折便于携带而拥有更广阔的发展前景,但柔性CZTSSe太阳能电池效率的提升受到背界面问题的制约,其主要原因是在高温硒化过程中CZTSSe与Mo之间发生分解反应,在界面处产生二次相、孔洞等,并生成较厚的Mo Se2层,使得空穴易于被复合损耗而难以传输至背电极。本论文将系统研究柔性CZTSSe太阳能电池背界面问题,改善背界面接触。针对柔性CZTSSe太阳能电
学位
近些年,信息技术不断推陈出新,给我们的社会、经济以及生活带来了前所未有的变化。在信息化浪潮的推动下,网络数据呈现爆发式的增长,信息过载的问题逐渐凸显出来,此时,最大限度地提高这些资源的利用率显得尤为重要。为了解决上述问题,越来越多的研究开始关注利用个性化推荐技术向用户提供他们真正想要的信息,避免用户浪费过多的时间在不必要的信息搜寻工作上。本文在个性化推荐技术的基础上,引入知识图谱作进一步的研究,并
学位
动静脉分离有助于肺部疾病的早期筛查与病理状态诊断,为肺部手术的术前规划、术中导航、术后评估等提供有效的参考,具有重要的临床意义。动静脉在CT图像上灰度和形态十分相近且部分动静脉分支相互黏连,而且一例肺部CT影像序列可包含数百层影像,熟练的医师重建一例患者动静脉一般需要耗时数个小时,过程繁琐复杂且容易出错。若能通过计算机辅助的方式自动、快速、准确地分离出动静脉血管树,可以减轻医生的工作量,合理规划肺
学位
近年来,高清视频监控得到了广泛应用。对视频中人体的异常行为进行自动识别可切实有效地保护人身及财产的安全,因此具有重要的应用价值。常见的人体异常行为识别方法主要通过提取运动目标的特征来进行建模。然而,实际监控场景存在背景复杂、运动目标数量不固定、异常行为的定义与具体的应用场景有关难以统一界定等各式各样的问题,增加了对人体异常行为识别的难度,使人体异常行为识别成为具有挑战性和研究意义的任务。本文设计一
学位