【摘 要】
:
基于区域候选网络(RPN)与孪生网络的框架可以快速的回归位置、形状信息,展现出了良好的跟踪速度和准确性。然而,采用的单阶段SiamRPN跟踪器不能有效地处理相似性干扰和大尺度变化等复杂情况。针对上述问题,本文提出了一个基于特征金字塔(FPN)的级联 RPN网络(简记为CF-RPN)的多阶段的跟踪框架。该框架的基础网络由一对孪生的FPN构成,其深高层到浅低层特征分别输送到级联的RPN模块中。相对于传
论文部分内容阅读
基于区域候选网络(RPN)与孪生网络的框架可以快速的回归位置、形状信息,展现出了良好的跟踪速度和准确性。然而,采用的单阶段SiamRPN跟踪器不能有效地处理相似性干扰和大尺度变化等复杂情况。针对上述问题,本文提出了一个基于特征金字塔(FPN)的级联 RPN网络(简记为CF-RPN)的多阶段的跟踪框架。该框架的基础网络由一对孪生的FPN构成,其深高层到浅低层特征分别输送到级联的RPN模块中。相对于传统RPN网络,级联 RPN网络具有多个锚点框,其锚点受前一级RPN的影响。与现有的算法相比,其一,多尺度
其他文献
当图像中文字区域形状复杂多变时,传统锚点方法难以精确定位文字,针对这一问题,提出一种具有双塔结构的文字分割检测算法。首先,在网络中增加自下而上的特征增强路径以充分提炼语义信息,与上一级自上而下的结构形成双金字塔模型;接着新增一条路径缩短较底层与最顶层特征之间的距离,同时使用膨胀卷积,增大卷积核的感受野;最后在损失函数的设计中引入γ参数,改变图像中正负样本的权重分配,使网络更关注困难样本。在标准数据
针对视网膜血管分割困难及时间复杂度高等问题,本文提出一种可以兼顾分割速度和准确度,同时结构非对称的视网膜血管分割模型,即紧凑混合网络(Compact Mixed Network, CMNet).首先,由于可变形卷积能够提取复杂多变的血管结构,并且混合深度卷积中的大核在增大感受野的同时能够改善分割质量,本文在此基础上提出一种轻量级混合瓶颈模块;其次,采用自适应层融合方法进一步提高了模型的空间映射能力
目标检测作为计算机视觉的任务之一已经成为研究热点问题。目前,基于深度学习的目标检测算法层出不穷,但大多数情况下学者只关心它们的模型架构,而忽视了其训练过程。目标检测网络在训练过程中会存在明显的不平衡问题,导致模型检测性能降低,不能达到预期的最佳效果。不平衡问题主要包括两个层次,分别是特征图层次和目标函数层次。为了能够充分发挥目标检测模型架构的潜力,实现更好的训练过程,本文提出利用Balanced
适宜的土壤水分对种子萌发、作物生长具有重要作用,基于土壤水分的播深调整技术需要对播种种沟土壤进行水分检测,以便根据落种点处的土壤水分信息进行播种调节,改变播种策略。本文设计了一种可见光-近红外(Visible and near-infrared,VIS-NIR)式土壤水分传感器。设计中,使用高分辨率光谱仪采集不同水分梯度的土壤光谱数据,采用偏最小二乘回归法(Partial least square
图像匹配是计算机视觉应用研究的主要内容。本文针对ORB图像匹配方法不具备尺度不变性和匹配精度低的问题,提出一种基于改进ORB算法的图像匹配方法。在特征点检测阶段,ORB和SURF同时检测特征点,首先采用oFAST与SURF算法检测左右图像特征点,之后使用rBRIEF描述子描述特征点;在立体匹配阶段,采用Hamming距离对特征点进行粗匹配的基础上,引入极线约束筛选特征点并进行精匹配,减小匹配搜索范
实现机械零部件传统纸质表格测试报告的数字化,是对其进行故障诊断及健康管理的前提条件。现有方法均是针对规则表格进行研究,对于纵向线段不连续、框线错位等现象的非规则表格研究依旧很欠缺。针对残缺表格存在跨页问题,提出了一种基于局部小区域内像素占比的跨页拼接算法;针对现有算法在表格识别及分割存在自适应差、鲁棒性欠佳问题,提出一种图像统计学聚类表格识别分割算法,并实现表格的数字化复现。对现有的147张数字化
目前图像描述技术的主要架构是基于深度神经网络的Encoder-Decoder架构.大多数工作集中在图像的特征提取和注意力机制上,如hard注意力模型和top-down注意力模型等.这些方法仅使用上一时刻的信息预测当前时刻的输出,使得解码器的输入信息的时间维度单一,同时解码器的单个输出也影响着预测结果的准确性.本文提出横向和纵向的多时间维度信息融合的图像描述模型,其中模型的横向结构使用过去和现在时刻
针对通过立体匹配直接得到视差图存在空洞等失真点(区域)的问题,本文提出一种基于自适应窗的视差优化方法。该方法先通过左右图像的视差一致性,检测出非零视差失真和黑洞失真区域,然后将所在像素点与周围像素点作视差代价比较,并针对由环境、光照以及其他噪声因素造成的误匹配所导致的黑洞区域,通过采用自适应窗填充黑洞失真区域,进而利用中值滤波平滑图像,最终实现对由立体相机左右图像匹配所获得的视差图的优化。通过与三
针对物联网入侵检测中检测数据不平衡导致的分类不准确的问题,提出了一种基于极端梯度提升树和随机森林相结合的物联网入侵检测模型。首先,针对物联网应用环境中产生的大量数据,对数据进行数据归一化处理。然后,利用XGBoost算法对其中的特征进行重要性评分,选择最优特征。最后,结合改进的随机森林算法,解决因数据不平衡导致的分类不准确的问题。仿真试验表明所提模型能有效的进行数据最优特征选择及合理地检测分类,同
针对图像拼接的实时性、准确度问题,本文提出了一种基于改进ORB特征点检测的图像拼接方法。方法在提取图像噪声点周边点的方式和判断特征点条件上进行改进。首先根据ORB算法判断特征点的特点将选取16个点减少为仅选取上下左右4个点,大大减少了质心与周边像素的比较次数;然后根据特征点延展性的特性,再在外圆选取4个相关点进行比较,快速区分噪点或是特征点,提高了特征点匹配准确率。本文还改进了随机取样一致性RAN