论文部分内容阅读
自然场景文本检测是从自然场景中检测出文本所在的位置,检测结果的好坏将直接影响后续的文本识别效果,在图像检索、自动驾驶等领域具有重要应用。提出CNN与RNN联合的自然场景文本检测方法。首先,采用CNN提取图片中多尺度特征并构建FPN;其次,为充分利用文本的序列特性,采用Bi-LSTM编码特征并输出一系列文本提议;最后,通过多向文本连接器连接生成的文本提议,实现多尺度、多方向的文本检测。通过在ICDAR2013、ICDAR2015以及USTB-SV1K数据集上进行测试,实验结果证明该算法在精确度和召回率