基于深度学习的实例分割研究综述

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:wst6681
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习在计算机视觉领域已经取得很大发展,虽然基于深度学习的实例分割研究近年来才成为研究热点,但其技术可广泛应用在自动驾驶,辅助医疗和遥感影像等领域。实例分割作为计算机视觉的基础问题之一,不仅需要对不同类别目标进行像素级别分割,还要对不同目标进行区分。此外,目标形状的灵活性,不同目标间的遮挡和繁琐的数据标注问题都使实例分割任务面临极大的挑战。本文首先对实例分割中一些具有价值的研究成果按照两阶段和单阶段两部分进行了系统性的总结。其次,分析了不同算法的优缺点并对比了模型在COCO数据集上的测试性能。此外
其他文献
为了提高单目视觉相机的测量精度及测试数据的可重复性,提出了一种应用于激光扫描投影中扫描镜的闭环控制方式来提高投影出的条纹位置的稳定性。利用集成在扫描镜上的压阻传感器提供的反馈信号进行闭环控制,同时针对压阻传感器的温度特性,设计了测试系统来标定压阻输出与温度关系曲线。通过记录每一个温度下压阻的反馈输出值,生成反馈输出与温度的关系表。在室温至70℃的温度区间内,扫描镜的扫描角度的变化量由3.52°减小
期刊
目的 提出一种基于深度学习技术的赤足足迹图像人身识别算法。方法 以ResNet50为基础网络,结合水平金字塔匹配(horizontal pyramid matching, HPM)技术提取赤足足迹图像的多尺度特征,并利用三元组损失函数SeparateTripletLoss对赤足足迹进行人身度量学习。结果 本文基于6433人的赤足足迹进行训练,在11028人的开集赤足数据集上进行测试,所提出的算法的
期刊
现有的风格迁移算法大多是实现艺术作品到真实场景,如照片等的转换任务。在这种任务设定下,图像内容的边界等结构信息可能会出现一定程度的变化,然而这种变化不利于下游任务的完成,因而不适用于大部分工业场景。为此提出一种新的结构保持的风格迁移方法,该方法分为频域约束的图像生成模块和基于memorybank机制的语义匹配模块。前者用以保证转换前后图像的整体语义结构一致性,而后者保证了图像的语义与风格匹配,从而
期刊
为快速准确计数大豆籽粒,提高大豆考种速度和育种水平,本研究提出了一种基于密度估计和VGG-Two(VGG-T)的大豆籽粒计数方法。首先针对大豆籽粒计数领域可用图像数据集缺乏的问题,提出了基于数字图像处理技术的预标注和人工修正标注相结合的快速目标点标注方法,加快建立带标注的公开可用大豆籽粒图像数据集。其次构建了适用于籽粒图像数据集的VGG-T网络计数模型,该模型基于VGG16,结合密度估计方法,实现
期刊
为解决目前单目图像深度估计过程中物体边界处深度跳变不明显导致的遮挡难以判别、边界处深度估计准确度较低的问题,提出了一种强化边缘的单目图像深度估计方法。采用深度估计网络输出最初预测的深度图,同时采用深度补偿网络输出应补偿深度的预测值,通过融合两组网络的输出实现对最初预测的深度图中物体边界轮廓处深度值的补偿。此外,通过设计点约束损失函数,并引入多尺度特征融合损失函数进一步提升边界处的深度估计精度。在N
期刊
胚胎发育是植物生长发育过程中极为重要的过程,而种胚败育现象在许多植物中普遍存在,研究植物种胚败育机制具有重要意义。文章对国内外植物种胚败育研究现状开展综述,重点阐述植物种胚败育生理生化、胚胎学及分子机理等方面研究进展。为进一步研究植物种胚败育机理、植物品种种质资源创新及无籽或无核果实性状育种应用提供理论基础。
期刊
铁路侵限异物的自动检测是未来实现铁路智能化的重要组成部分。由于随机的侵限行为可能导致严重的行车后果,研究可以实现连续检测列车运行前方区域状况的技术,是保障列车出行安全的现实需求。针对传统侵限异物检测方法检测类别单一和时效性差的不足,提出一种基于YOLO v4检测网络的侵限异物检测模型。在锚框(anchor)的选择上,通过对K-means算法聚类中心的选取方法进行改进,用欧式距离度量替换随机选择的方
期刊
针对人脸识别技术应用中,使用人脸图像或虚拟人脸等技术手段欺骗识别系统进而降低系统安全性的问题,提出了一种多模态特征融合的人脸活体检测算法。该算法将人脸的RGB图,深度图(Depth)和红外图(Infrared Radiation,IR)分别输入到三个相同的残差网络结构中提取特征;通过基于通道注意力机制的方式对三个模态的特征图进行融合;对融合特征做出决策。在CASIA-SURF数据集上多次实验表明,
期刊
研究Faster R-CNN目标检测网络的基本结构与训练方法;建立了机电装备状态数据集,训练了目标检测网络,一步实现了指针式仪表区域的提取、数字式仪表读数的识别以及开关、插头状态的识别;在不同视角和光照强度下对目标检测网络进行了测试,结果表明模型在不同的环境中均能保持90%以上的准确度。并以此为依据推理故障的原因,最后根据推理结果,使用基于Unity 3D软件与Hololens 2硬件开发的机电装
期刊
在模糊C均值模型中引入邻域信息是一种有效的减少噪声影响的图像分割方法,然而,这种算法对类差异敏感,故提出具有鲁棒性对类差异不敏感的模糊C均值算法。首先,基于隶属度构建一种类指数形式的抑制势表达式来抑制较大类对目标函数的作用,并将其引入至基于像素包的模糊C均值算法的目标函数中。然后,根据构建的目标函数利用拉格朗日乘子法推导出新的聚类中心和隶属度的表征形式。最后,采用类差异大的无损检测图像进行分割实验
期刊