【摘 要】
:
在计算机视觉领域,图像分割作为非常关键的部分,是该领域基础问题之一。在实际应用过程中具有极大的价值。本文的研究基于图像分割中两个重要子领域:图像语义分割和显著性目标检测。图像语义分割是从像素层面对图像中的目标进行分类,基本要求是每一个像素都应被正确地分类。显著目标检测来源于视觉显著性,主要任务是寻找一张图像中人眼最关注的目标区域。但是显著目标检测只是得到显著这一种类型的目标,可以看成一个二分类问题
论文部分内容阅读
在计算机视觉领域,图像分割作为非常关键的部分,是该领域基础问题之一。在实际应用过程中具有极大的价值。本文的研究基于图像分割中两个重要子领域:图像语义分割和显著性目标检测。图像语义分割是从像素层面对图像中的目标进行分类,基本要求是每一个像素都应被正确地分类。显著目标检测来源于视觉显著性,主要任务是寻找一张图像中人眼最关注的目标区域。但是显著目标检测只是得到显著这一种类型的目标,可以看成一个二分类问题,因此显著目标检测偏向语义分割领域发展,最终形成了现在这种几乎可以称为二分割的领域。本文在网络模型和损失函数两方面进行了创新。一方面,针对语义分割任务,本文在网络模型方面,提出了融合上下文内容的深度学习网络模型,该模型获取了特征与特征间的关联性控制目标的语义分割。通过对特征之间的依赖信息进行建模,将特征间上下文信息的获取作为主要任务,来控制目标的精确分割。实验证明本文的网络模型具备较好的分割效果。另一方面,针对显著性目标检测任务,本文在损失函数方面引进传统活动轮廓模型分割方法中的能量函数思维,构建提取目标本身特征的损失函数,引入能量惩罚项,使得损失函数具备快速收敛的特性。实验证明该损失函数能够缩短模型训练时间,泛化到众多深度学习网络模型中,并在各大网络框架中都能够控制模型提高分割精度。本文在实验过程中使用平均交并比和平均像素准确度来定性衡量方法性能,与众多传统模型进行对比,同时也在常用数据集上进行了实验,验证了本文内容的应用性及可行性。本文的贡献在于解决了图像上下文信息在传统深度神经网络中缺失的不足,引入了特征与特征之间关系,构建了全新神经网络。同时提出结合传统图像分割领域内的活动轮廓模型,将水平集能量函数思维引入损失函数中,构建了一种结合目标轮廓长度、面积,并能够快速收敛的损失函数。实验证明本文网络模型及损失函数均具有可观性能,泛化能力强,可以在图像分割中广泛应用。
其他文献
随着人工智能的发展,司法正逐步由电子化、信息化转向智能化。运用法律检索、分析与推荐平台在浩瀚的法律文书中快速查找到感兴趣的案件,能将人们从繁琐的工作中解放出来,大大提升工作效率,这无疑是现代司法最迫切的需求。该问题属于法律案件相似度计算问题。目前国内在法律文本相似度计算方面,采用的方法主要是通用领域的文本相似度计算方法,这些方法没有考虑法律文本的特点,在案件相似度计算方面仍存在许多问题。首先,目前
无功优化是改善配电网电压质量,降低网络损耗的重要手段。目前大规模的分布式电源接入配电网,为无功优化带来了新的难度。相比于传统配电网,有源配电网的动态无功优化更为复杂,一方面,有源配电网的无功控制设备既有电容器组等离散控制设备,又有分布式电源(distributed generator,DG)等连续控制设备。离散控制设备不可频繁投切的特点导致各优化时段相耦合,这使得动态无功优化成为强时空耦合的混合整
随着高级量测体系在智能电网中的深入应用,智能电网中的公共事业服务单元和需求侧端的电力消费者之间的交流更加频繁。新兴技术在智能电网中的广泛应用,使得越来越多的节点加入到电力网络。节点之间良好深入交互的同时,也产生了大量数据,这些数据中包括了具体用电消费者的隐私,如果被不法分子利用,将对用户造成危害,甚至对整个电网造成损害。本文针对高级量测体系中用户用电数据安全传输,以及网络中用户隐私保护两个方面进行
金属离子掺杂的光致发光材料在工业生产以及生活中发挥着重要的作用,其中Mn4+激活的荧光粉在农业生产、传感技术、照明与显示等领域有着极为广阔的应用前景。为了开发高效率的Mn4+激活的荧光粉以满足各领域的需求,本文选择以钙钛矿结构的钨酸盐氧化物为基质,研究了Mn4+离子的发光性质。开展的工作如下:(1)通过高温固相法合成了一系列的Mn4+单掺杂的K1-xLa1+x/3Mg WO6和K1-xLixLa
如今,“低碳发展”已成为全球经济发展的一种重要理念,推行低碳交通也成为了各个国家的战略选择。电气化铁路由于具有节能环保、经济便捷、运输能力强等优点,成为了低碳交通中的一种重要方式。因此,电气化铁路的诞生与成功,让世界重新审视铁路的价值。电气化铁路的负荷主要为电力机车牵引负荷,其具有单相性、非线性、随机波动性以及制动时会产生能量的特点,会给牵引供电系统带来复杂的电能质量问题和再生制动能量利用问题。传
随着机器人逐渐替代人力,工厂朝着高度智能化、规模化的方向发展,实现移动机器人自主导航,具有非常远大的意义。自主导航任务中,同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)是其中的关键技术,是通过对一个环境的局部观测来构造一个全局一致模型的过程。由于视觉传感器的独特优势,视觉SLAM成为近几年的研究热点,但是易受环境光线明暗不一致、纹理缺失等
发现具有更优性能和更具应用前景的二维材料,是目前物理学研究的一个重要目标。由第IV主族元素C和Si形成的石墨烯和硅稀有着优异性质,它们在能量的存储转化、信息处理和催化等方面有良好的应用前景,有望成为新一代的电子器件材料。近年来,研究发现通过对石墨烯掺入Si原子可以得到硅石墨烯(siligraphene),它具有石墨烯和硅稀所不具备的许多优异性能因而受到了广泛关注。石墨烯是平面结构而硅稀是翘曲结构,
近年来,随着深度学习领域的高速发展,计算机视觉领域衍生出了许多新兴领域,其中语义分割也是众多新兴领域之一。本文从解决语义分割在实际应用中的问题分别从解决分割的精确度与分割的时效性两个角度出发进行了模型的分析与改进。从分割精度的角度出发通过引进注意力机制来对重要特征进行针对性的特征提取来提高模型的准确率。从时效性的角度出发通过多尺寸特征图分级提取特征来降低网络提取特征所需要的时间。首先本文对近年来语
重复控制的本质是内模控制,其时滞环节可以通过状态空间描述和提升技巧融合到增广系统中,能够有效解决周期性外激励信号控制问题,意味着可以准确跟踪或抑制周期性信号。预见控制可以在不改变闭环系统动态结构的情况下,利用期望目标的未来信息减少因外在干扰造成的系统扰动,继而系统的跟踪稳定性得以提升。对于高性能的伺服系统来说,不能忽略时滞的存在。本文在预见控制和重复控制已存在较多研究成果的基础上,针对几类不确定线
在陌生场景下,机器人的首要任务就是获取位置及其周边信息,其中的关键技术就是同时定位与建图(Simultaneous Localization and Mapping,SLAM),由于其在机器人领域上的应用前景,视觉SLAM的相关研究引起了广泛的关注。本论文在经典视觉SLAM框架的基础上,对视觉里程计和闭环检测两个模块进行研究。在视觉里程计模块,针对传统方法存在的鲁棒性差和尺度漂移问题,提出了基于深