基于弱监督学习的交互式图像分割的方法研究

来源 :厦门理工学院 | 被引量 : 0次 | 上传用户:ab869
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的不断发展,利用像素级标签对任何感兴趣区域分割的自动图像分割的方法层出不穷,且精度也是越来越高,甚至达到了人类识别的平均水平。但像素级标签的要求是每个像素都有对应的标签或者背景,这需要大量标注人员的劳动及财力成本。特别地,医学图像领域的像素级标签需要标注病灶区域、手术工具区域等,这需要额外的领域专家知识成本。因此,像素级标签难获取的问题显得十分突出。本文对自动图像分割技术需要精确且昂贵的像素级标签做了大量调研和分析,发现缓解此问题的主要做法是弱监督语义分割和交互式图像分割。于是,本文对两种方法进行了进一步的研究,发现了它们主要的缺点有:前者的分割精度(MIOU)与使用像素级标签的自动分割方法相差甚远;后者的分割精度(MIOU)虽然很高,甚至超出前者,但推理模型是利用像素级标签训练得出。即,它们都没有摆脱代价高的像素级标签的束缚。为了降低对像素级别标签的依赖,本文结合前者不使用像素级标签和后者精度高的特点,主要贡献与内容如下:(1)针对普通图像数据集,本文提出了一种基于弱监督学习的交互式图像分割方法。首先为了摆脱像素级标签的影响,本文提出使用类激活映射的方法对图片数据集进行处理,且为了更好地保留位置信息和类别信息,进一步提出了使用双分支结构纯化信息制作成伪标签。然后进入到交互式图像分割阶段,利用上一步的伪标签和交互点击策略在交互式图像分割框架下训练出交互式推理模型,提出在推理模型的基础上引用用户交互这种弱监督信息去优化分割结果,其结果优于其他弱监督语义分割方法。(2)针对具有细粒度性质的医学图像数据集,本文提出了一种基于弱监督学习的交互式医学图像分割方法。首先本文只使用了医学图像数据集的类别信息,并同样使用类激活映射的方法,保留图像的位置信息和类别信息。然后在双分支结构下提出使用形态学的方法去掉毛刺去纯化位置信息和类别信息,进一步地制作为伪标签。在交互式图像分割阶段,针对细粒度级别的信息,提出使用注意力机制分割框架,解决了分割区域类似而不易区分的问题。最后,使用伪标签和交互点击策略得到交互式推理模型,并引入用户交互信息优化分割结果,其结果接近自动图像分割方法。
其他文献
目的:探讨益气养阴活血方通过调控核因子E2相关因子2(nuclear factor erythroid-2 related factor 2, Nrf2)/NOD样受体蛋白3(NOD-like receptor thermal protein domain associated protein 3,NLRP3)信号通路对糖尿病肾病(diabetic nephropathy,DN)大鼠的肾脏保护作用
期刊
在医疗保险制度改革不断深入的过程中,参保覆盖面逐步扩大,医保欺诈现象也变得越来越频繁。医疗保险欺诈的行为有多种方式,例如违规使用医保卡,伪造医疗服务的虚假账单,甚至出现一些有组织的团体性欺诈犯罪活动,严重损害参保人利益和医疗保险基金安全。尽管已有多种欺诈检测方法被提出用于解决这个问题,但由于医保欺诈类型多样,医保数据具有高度隐私性和样本独立性,现有方法还无法有效解决这些问题。因此,需要一种仅涉及少
学位
视觉目标跟踪在计算机视觉领域一直是一个基础并活跃的研究课题,其在视频监控、无人驾驶、人机交互以及无人机等方面有着广泛的应用。得益于深度学习和大数据的发展,以及卷积神经网络在目标跟踪领域的应用,目标跟踪在过去的几年里取得了显著进展。特别地,基于孪生网络的跟踪算法通常能够在准确性和速度之间取得较好的平衡,因此得到了更广泛的关注。孪生跟踪模型根据测试过程是否更新模型,可以分为在线跟踪器和离线跟踪器。前者
学位
现有地坪磨抛机存在依赖人工、效率低的问题,且作业中存在机械性严重、噪声污染、粉尘污染等问题严重危害工人身心健康,因此研究自主导航地坪磨抛机提高工作效率降低人力成本,对促进建筑行业发展具有重要意义。本文依托泉州市科技计划项目“基于激光雷达的自主导航地坪磨抛机研发”开展基于激光雷达的自主导航地坪磨抛机算法研究工作,主要包括粉尘环境下SLAM建图、全覆盖路径规划、机器人运动控制算法的研究。本文的主要工作
学位
自2021年6月入驻B站以来,人民日报将国内外新闻资讯、时事热点与B站特有的二次元文化生态相结合,形成了深度融合的传播策略:依托B站独特的弹幕体系、评论区文化,实现主流话语符号的意义共享与再生产;通过征用传统文化符号资源、叙述民族国家历史,唤醒泛二次元用户群体的集体记忆,实现其身份确认;将严肃议题与亚文化元素结合,获得圈层内用户的认可和支持;联结B站兴趣圈层意见领袖,与知名UP主联合创作。这些举措
期刊
电压暂降是配电网中最不可避免的电能质量障碍之一,极有可能给工业用户带来经济损失。准确辨识电压暂降的原因及定位故障源,有助于及时制定干扰处理计划,明确责任,有效地减少经济损失。常见电压暂降类型有:单相接地故障、相间短路故障、大容量电动机故障、雷电冲击引起的故障,在上述背景下,如何利用电压波形监测来提升电压故障类型识别以及故障源定位成为迫切解决的课题,针对配电网监测系统采集的故障波形图不够丰富,生成的
学位
流域经济是以河流为纽带的一个区域经济范围或者一个系统,是资源和经济的耦合。在流域经济视角下,四川白酒产业还存在较大的成长空间。本文分析了在四川众多河流组成的长江上游流域经济系统中,四川白酒产业的发展规律、方向和重点,并以此重构了四川白酒产业的空间结构。同时,本文认为从流域产业开发的视角来看,四川白酒产业在新的空间结构下,需注重推动产业由金字塔型向橄榄型转变,推进跨区域、跨产业的企业交流合作以及加强
期刊
电力行业、矿业和建筑业等行业在生产过程中频有事故发生,导致人员伤亡和经济损失。将目标检测和行为检测技术应用到安全作业视频监控系统,能够可靠地、有效地解决上述问题。因此,本文开展作业人员违章行为检测技术研究。本文主要围绕违章目标检测技术和违章行为检测技术展开研究。从现实违章行为监控的场景特点和实际技术需求出发,特别针对刚性目标的复杂背景、柔性目标的锚框定位困难以及违章行为检测中正、负样本不均衡等问题
学位
目的:观察金锁固精丸加味方对糖尿病肾病大鼠的保护作用。方法:将糖尿病肾病大鼠随机分组,分为中药常规剂量组、中药加倍剂量组、雷帕霉素组及模型对照组,并设置正常对照组。在造模给药后第12周,观察各组大鼠的一般情况,检测空腹血糖(FBG)、血尿素氮(BUN)、血肌酐(SCr)、总胆固醇(TC)、24 h尿白蛋白定量(24 hUAlb)和血清白蛋白(Alb)水平,并用过碘酸-雪夫反应(PAS)染色光镜下及
期刊
随着科技的飞速发展,图像、语音等多媒体数据的体量也在随之急速增长。面对着日益增大的数据存储需求,价格便宜且方便快捷的云存储服务迅速占领了市场。为了避免云端的存储数据被泄露,最直接的解决方案是将数据先加密再上传云端。在密文检索技术还没出现的时候,用户需要某个指定文件就只能把云端所有数据都下载到本地再一一解密后查找,这造成资源极大的浪费。因此实现对云端加密文件的检索是一个有意义的研究课题。当下,基于文
学位