【摘 要】
:
图像显著物体检测的目的是识别出图像中最重要的物体区域,并将目标区域从背景中剥离出来。由于图像中的显著物体容易受到背景区域的干扰,使得图像显著物体检测非常具有挑战性,为了提高图像显著物体检测的性能,本文对图像显著物体检测算法进行了研究,提出两种图像显著物体检测算法。一种是基于特征增强与融合的显著物体检测方法。该方法首先利用卷积神经网络提取RGB图像的不同卷积层的特征,然后使用图像的高层特征信息指导低
论文部分内容阅读
图像显著物体检测的目的是识别出图像中最重要的物体区域,并将目标区域从背景中剥离出来。由于图像中的显著物体容易受到背景区域的干扰,使得图像显著物体检测非常具有挑战性,为了提高图像显著物体检测的性能,本文对图像显著物体检测算法进行了研究,提出两种图像显著物体检测算法。一种是基于特征增强与融合的显著物体检测方法。该方法首先利用卷积神经网络提取RGB图像的不同卷积层的特征,然后使用图像的高层特征信息指导低层特征的预测,提出高层语义特征指导回归模块;其次,基于高层特征对迎道信息较为敏感,底层特征对空间信息较为敏感,使用通道注意和空间注意分别对高层特征和底层特征加权,提出多尺度特征加权算法;最后,将加权之后的特征进行融合,并进行损失训练得到最终的显著图。另一种是跨尺度特征感知与结合的RGBD图像显著物体检测方法。该方法在RGB图像的基础上加入了深度图像,基于RGBD图像显著物体检测综合考虑了 RGB图像所包含的颜色、方向、亮度、纹理以及空间特征,还包含了图像的深度信息。因此,本文提出跨尺度特征感知与结合的RGBD 图像显著物体检测方法,将原始图像与深度图像结合起来,首先通过特征感知模块,来扩大特征的感受野以及增强特征的鲁棒性;然后使用跨尺度特征感知单元来融合不同尺度的特征,提高特征包含的细节信息,增大特征拥有的信息量;最后使用跨尺度特征结合单元将深度图像不同尺度的特征与RGB图像不同尺度的特征结合起来精确提取显著物体。最后将两种算法得到的显著图像与主流算法进行比较,实验结果表明本文提出的两种算法在五个公开数据集上均优于其他主流算法。
其他文献
流数据具有实时、连续、动态变化的特点,其广泛存在于网络监测、金融交易以及传感器检测等领域。从流数据中挖掘信息、发现规律,并对系统行为进行分析,预测未来的变化趋势,可以提高生产生活中的决策和评判效率,具有重要意义。流数据海量实时的特点,要求处理系统需具备高负荷的处理能力。基于CPU(Central Processing Unit)的串行处理是当前处理流数据的主要方式。串行方式不仅耗时长,而且难以达到
针对袜企目前打样周期长、与袜品卖家沟通时间长等问题,探索对三维电子袜样的仿真模拟技术及相关软件开发。本人以Pierce模型为基础,对纬编针织物单位线圈进行建模,再对其组织结构进行分析研究,在Visual Studio环境下,使用VC++语言,借助3dsmax工具实现了三维电子袜样的模拟。模拟结果很好地表现了纬编针织组织在空间中的串套关系,同时直观展示了袜品的三维编织效果。主要完成了以下工作:(1)
随着深度学习与人工智能技术的不断发展,人体行为识别技术得到了越来越多的关注,其广泛应用于人机交互、无人商店、安防监控、病人护理、虚拟现实等领域。行为识别的目标是从场景中的视频图像序列中对人体动作进行理解分析,准确高效显得尤为关键。因深度传感器可有效的避免受到光照、遮挡,环境变化等因素的影响,基于骨骼数据的行为识别方法在模式识别领域成为了热门研究方向。在近几年的研究中,将人体姿态建模为时空图结构的图
陕西凤翔木版年画作为中国传统民间美术代表之一,发源于西北民间,其画面形象和色彩风格均是数百年来关中民间百姓审美取向的体现,因此具有独树一帜的民间艺术风格和浓郁的关中地方特色,也因此吸引了无数爱好者。近年来,伴随着我国对民间艺术传承与发展重视性的提高以及人民群众对民间传统艺术的欣赏,凤翔木版年画不仅在国内名声赫赫,并且走出国门走向世界,受到众多海外艺术家和爱好者的赞美,并且被国内外许多研究单位、艺术
行人重识别技术(Person re-idcntification,re-id)是一种利用计算机视觉技术来准确判断图像或者视频序列中是否存在特定行人的技术,一般认为这是图像检索的子问题。近年来深度学习的不断发展使得行人重识别技术取得了极大地成功,该技术也在智能安防和智能监控等领域得到广泛应用。由于行人容易受到姿态变化、视角改变、复杂背景以及遮挡等方面的影响,使得行人难以被识别和检索,目前存在许多亟待
随着人工智能的快速发展,行人动作识别在视频监控、人机交互、动作分析及智能安防等领域得到了越来越广泛的应用。传统的行人动作识别大都是基于RGB视频或图像进行识别,但由于目标遮挡、光照变化和背景复杂等问题,行人动作识别效果并不理想。随着Kinect等深度传感器的普及,基于骨骼点的行人动作识别受到了广泛关注。现阶段对RGB视频进行基于骨骼点的动作识别方法中,通常采用骨骼点检测网络和基于骨骼点的动作识别网
混合现实技术发展相对成熟,应用广泛。HoloLens混合现实眼镜作为混合现实代表设备之一,其空间映射技术通过使用SLAM和计算机视觉技术帮助用户完成空间定位、扫描和重建工作,然而其并未对反映真实空间物体表面形状的网格进行分割和识别,在混合现实应用中无法完成基于分割对象的高级语义交互。因此,本文提出基于HoloLens空间映射的三维场景分割和识别研究。利用HoloLens完成室内三维数据采集,制作数
一直以来,印刷品作为常见信息交流工具,广泛地应用于生产生活。但其极易被不法分子复制甚至篡改,对社会的知识产权安全和生产创新带来了极大的破坏。传统的数字水印技术是保护信息安全的一大措施,但应用范围有限,无法有效应对打印扫描攻击,同时还有透明性、嵌入容量较低的缺陷。如何开发出能够抵抗打印扫描攻击的水印算法成为社会研究热点。目前,变换域算法能够有效的解决这一现状,其中DWT变换后的LL分量具有较好的鲁棒
随着新一代信息技术的创新发展,袜业制造行业从传统的手工生产逐步向数字化、智能化和柔性化的方向转型,但在袜品反求生产领域尚处在传统的人工打样阶段。本文结合袜子制版文件特征与图像特征提取技术的发展现状,将三维立体袜品转换为正反面拼接的数字图像,对样板袜品进行图像采集、袜子制版文件反求、袜子制版文件二次设计等功能设计,研发一种数字化、自动化的袜子制版文件反求生成系统。本文的主要研究内容如下:(1)基于颜
随着我国移动端、互联网技术的飞速发展,屏幕内容图像(Screen content image,SCI)的主成数量越来越多。然而,在对SCI进行获取、传输和压缩等过程中易产生噪声干扰和图像失真,这种干扰和失真造成的图像质量下降难以被精准评估和预测。基于自然图像的评估SCI的视觉质量预测中不能起到有效作用,已成为制约SCI评估指标提高的关键问题。因此,对客观的屏幕内容图像质量评估方法进行高效分析和建立