面向自然场景文本检测的改进NMS算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:albeewang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,卷积神经网络算法在自然场景文本检测效果上较传统算法已经有了很大提升,但如何有效处理神经网络输出层候选框仍然值得研究。非极大值抑制算法(Non-maximum suppression,简称NMS)通过选择最高置信度候选框作为检测结果,往往容易对较长文本以及混叠文本区域检测失效。考虑到该问题,可以将候选框集合进行排序滤波与融合计算,得到更准确的候选框,有效减少上述检测失效的情况。这种方法,可以直接嵌入原有方法中,而不需要改变网络结构或者增加任何训练量。通过在公开数据集上进行实验,对比其他方法,
其他文献
图像匹配是计算机视觉应用研究的主要内容。本文针对ORB图像匹配方法不具备尺度不变性和匹配精度低的问题,提出一种基于改进ORB算法的图像匹配方法。在特征点检测阶段,ORB和SURF同时检测特征点,首先采用oFAST与SURF算法检测左右图像特征点,之后使用rBRIEF描述子描述特征点;在立体匹配阶段,采用Hamming距离对特征点进行粗匹配的基础上,引入极线约束筛选特征点并进行精匹配,减小匹配搜索范
期刊
实现机械零部件传统纸质表格测试报告的数字化,是对其进行故障诊断及健康管理的前提条件。现有方法均是针对规则表格进行研究,对于纵向线段不连续、框线错位等现象的非规则表格研究依旧很欠缺。针对残缺表格存在跨页问题,提出了一种基于局部小区域内像素占比的跨页拼接算法;针对现有算法在表格识别及分割存在自适应差、鲁棒性欠佳问题,提出一种图像统计学聚类表格识别分割算法,并实现表格的数字化复现。对现有的147张数字化
期刊
目前图像描述技术的主要架构是基于深度神经网络的Encoder-Decoder架构.大多数工作集中在图像的特征提取和注意力机制上,如hard注意力模型和top-down注意力模型等.这些方法仅使用上一时刻的信息预测当前时刻的输出,使得解码器的输入信息的时间维度单一,同时解码器的单个输出也影响着预测结果的准确性.本文提出横向和纵向的多时间维度信息融合的图像描述模型,其中模型的横向结构使用过去和现在时刻
期刊
针对通过立体匹配直接得到视差图存在空洞等失真点(区域)的问题,本文提出一种基于自适应窗的视差优化方法。该方法先通过左右图像的视差一致性,检测出非零视差失真和黑洞失真区域,然后将所在像素点与周围像素点作视差代价比较,并针对由环境、光照以及其他噪声因素造成的误匹配所导致的黑洞区域,通过采用自适应窗填充黑洞失真区域,进而利用中值滤波平滑图像,最终实现对由立体相机左右图像匹配所获得的视差图的优化。通过与三
期刊
针对物联网入侵检测中检测数据不平衡导致的分类不准确的问题,提出了一种基于极端梯度提升树和随机森林相结合的物联网入侵检测模型。首先,针对物联网应用环境中产生的大量数据,对数据进行数据归一化处理。然后,利用XGBoost算法对其中的特征进行重要性评分,选择最优特征。最后,结合改进的随机森林算法,解决因数据不平衡导致的分类不准确的问题。仿真试验表明所提模型能有效的进行数据最优特征选择及合理地检测分类,同
期刊
针对图像拼接的实时性、准确度问题,本文提出了一种基于改进ORB特征点检测的图像拼接方法。方法在提取图像噪声点周边点的方式和判断特征点条件上进行改进。首先根据ORB算法判断特征点的特点将选取16个点减少为仅选取上下左右4个点,大大减少了质心与周边像素的比较次数;然后根据特征点延展性的特性,再在外圆选取4个相关点进行比较,快速区分噪点或是特征点,提高了特征点匹配准确率。本文还改进了随机取样一致性RAN
期刊
基于区域候选网络(RPN)与孪生网络的框架可以快速的回归位置、形状信息,展现出了良好的跟踪速度和准确性。然而,采用的单阶段SiamRPN跟踪器不能有效地处理相似性干扰和大尺度变化等复杂情况。针对上述问题,本文提出了一个基于特征金字塔(FPN)的级联 RPN网络(简记为CF-RPN)的多阶段的跟踪框架。该框架的基础网络由一对孪生的FPN构成,其深高层到浅低层特征分别输送到级联的RPN模块中。相对于传
期刊
针对美式手语(American Sign Language,ASL)识别时存在识别准确率较低,模型训练时间过长等问题,提出了一种双向二维主成分分析(2D2DPCA)与卷积神经网络(CNN)相结合,使用贝叶斯算法(Bayesian Optimization,BO)优化模型参数的算法。该算法首先使用2D2DPCA算法对原始图片数据降维,提取行、列方向的特征图;然后使用卷积神经网络对特征图进行训练分类;
期刊
针对传统边界跟踪算法搜索范围较大、判断次数较多这一状况,在分析了游程编码方法的基础上提出了一种基于“弦”的边界跟踪算法。该算法以弦为搜索单位,不需要扫描所有边界点的八邻域。并且该算法在基于游程编码的连通域标记后可以直接进行轮廓提取,避免了传统边界跟踪算法在连通域标记后要先将连通域转换为光栅图像形式再提取轮廓的方式。实验结果表明,该算法相较于传统的边界跟踪算法,效率有了显著的提升。
期刊
为剔除无人机多光谱图像中的土壤背景,提高作物根域土壤含水率反演精度。以不同水分处理的拔节期冬小麦为研究对象,利用无人机多光谱相机分别在9:00、11:00、13:00、15:00和17:00等5个时刻获取高分辨率多光谱图像,运用改进的植被指数阈值法快速确定植被像元与土壤像元的分类阈值,通过阈值划分实现土壤背景的剔除,并根据植被指数阈值法的阈值变化,研究土壤背景对提取冬小麦冠层反射率的影响,最后建立
期刊