一种结合图像分割掩膜边缘优化的B-PointRend网络方法

来源 :中国体视学与图像分析 | 被引量 : 0次 | 上传用户:hanhan069
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实例分割的过程中,Mask R-CNN在CNN特征之上添加全卷积网络(FCN)来生成图像掩膜。其生成的掩膜是由28×28预测掩膜放大为检测框尺寸得到的,因而对于物体边缘不敏感,PointRend通过对实例边缘的"难点"进一步处理得到更精确的实例分割结果,但由于"难点"为两个类别的边界,所以并不容易确定类别。本文提出了一种改进的B-PointRend方法,该方法把图像的像素尺度信息加入到预测中,在实例分割流程之后增添一个边缘修正步骤,采用像素级别的图像边缘检测和处理方式,在分割结果尺度上对检测框掩膜
其他文献
近年来,基于自注意力机制的神经网络在计算机视觉任务中得到广泛的应用。随着智能交通系统的广泛应用,面对复杂多变的交通场景,车牌识别任务的难度不断提高,准确识别的需求更加迫切。因此提出一个基于自注意力的免矫正的车牌识别方法 T-LPR。首先对图像进行切片和序列化,并使用3D卷积对切片序列进行特征提取,从而得到图像的嵌入向量序列。然后将嵌入向量序列输入基于Transformer Encoder的编码器中
期刊
提出一种基于视觉显著性的车载单目相机自运动估计及前车尺度估计方法。首先,针对车载相机自运动估计,通过视觉显著性计算方法检测并去除含有噪声的单目图像序列中的运动目标,同时考虑图像的纹理区域和平滑区域,利用加权显著图保留有用特征点,进而对车载相机进行鲁棒的自运动估计。其次,将前车距离转化为前车尺度估计问题,通过描述子匹配与李代数中正则化的强度匹配相结合的方法最小化损失函数,通过设计视觉注意力机制选择有
期刊
针对多光谱行人检测系统存在特征融合质量低、模型超参数多且锚框匹配算法复杂等问题,提出了一种基于差分特征注意力机制的无锚框多光谱行人检测算法。该算法首先采用差分特征感知融合方法挖掘多模态特征间的互补信息来优化通道特征;然后利用具有高效无锚框机制的CenterNet检测框架大大降低了模型计算复杂度,从而提升检测速度;最后引入差分特征注意力机制,改善特征融合质量,进一步提升检测精度。在KAIST、CVC
期刊
提出了一种基于三视图像由粗到精的三维人脸建模方法。粗糙建模阶段,针对输入三视图像中定位特征点的精准匹配问题,提出了一种基于改进LBP(Local Binary Patterns)特征的稀疏匹配方法进行匹配,进而计算特征点的深度并恢复真实三维坐标,将其映射到通用人脸模型实现形变,生成粗糙人脸模型。精细建模阶段,以粗糙人脸为初始形状,通过增加特征及纹理先验约束,按比例重新定义双线性模型的能量函数并进行
期刊
提出一种基于最大相关熵和局部约束的协同表示分类器(CRC/MCCLC),该分类器能同时利用最大相关熵和局部信息。一方面,通过利用最大相关熵准则,CRC/MCCLC不仅在异常值处理上比L1范数鲁棒性更高,还可以使用半二次优化技术进行更有效的计算;另一方面,CRC/MCCLC通过使用局部信息得到近似稀疏表示,以此从训练样本中获得更多的判别信息。在ORL、Yale以及AR人脸数据集等图像数据集上的实验结
期刊
鉴别图像中的真伪人脸是一个长期具有挑战性的问题。当合成的伪造人脸十分逼真时,机器识别难分真假,甚至肉眼也难以区分。基于监督学习的真伪人脸识别建模往往需要大量的标签样本,模型的性能严重依赖样本的规模。提出一种基于半监督学习的人脸识别反欺骗方法,以减少对大量标签样本的依赖。该方法利用图像修复模型来学习人脸图像潜在的数据分布。在训练过程中,少量标签样本周期性地提供有监督信号来训练分类器,以区分真伪人脸。
期刊
针对头戴式视线跟踪的三维方法获取视线方向,通常需要复杂的硬件结构或者是需要使用眼睛平均生理参数的问题,提出一种基于瞳孔轮廓的三维眼球拟合模型。在只使用单相机的条件下,根据瞳孔轮廓的运动轨迹拟合模型获取三维视线方向,并在此基础上提出了一种三维到二维的视线映射模型。避免了头戴式设备的复杂结构和对眼睛平均参数的使用。实验结果表明,该方法能够提高注视精度和简化硬件结构。
期刊
【目的】智能虫情测报灯诱捕到的农业害虫因种类繁多、虫体姿态多样、鳞片脱落等原因造成有些害虫图像存在种间相似和种内差异的现象。为了提高农业灯诱害虫识别率,针对YOLOv4检测模型检测到且容易混淆的19种灯诱害虫,本文提出了基于双线性注意力网络的农业灯诱害虫细粒度图像识别模型。【方法】首先,根据灯诱害虫外观图像的相似性和检测误检的情况,将19种害虫分为6类;将所有害虫图像通过补边操作使得长宽相等,并缩
期刊
引导滤波广泛应用于多聚焦图像融合算法,但是其边缘提取机理导致其无法精确划分多聚焦源图像中聚焦区域的平坦部分。对此,本文提出了一种结合双梯度信息的改进引导滤波融合算法。首先,本文优化了引导滤波提取图像聚焦区域纹理特征的流程,并且引入了高斯平滑来增强离焦区域和聚焦区域的灰度对比度差异,从而可以更精确地提取聚焦区域的平坦部分。同时,本文利用源图像和边缘特征图的双重梯度信息来判定聚焦与离焦区域,生成区域分
期刊
自动驾驶是目前备受关注的领域,无人小车模拟交通场景、集目标检测、避障等功能于一体,实现自动行驶。基于华为云的AI开发平台——ModelArts为整个流程提供了智能数据标注及模型训练。根据实际场景,利用现有数据集加工、处理,并采用不同算法进行实验得出效果最好的算法,根据实际环境对算法做相应改进,实现模拟交通场景的行驶过程。
期刊