论文部分内容阅读
本文针对电力行业,设计场景构建的结构规范,并基于OCR技术,实现对单据附件等图像文字的快速分类和批量识别,然后与场景构建中配置的关键提取信息项进行自动匹配,过滤出需处理的信息,该过程替代了传统的事后人工稽核的机制,及时纠正各类风险的发生,降低风险因素的累计和减少风险的发生率,实现了电力营销业务的稽核。系统采用TensorFlow+PyTorch+Warp-CTC的组合框架,使用CNN、CTPN、CRNN算法构建OCR识别服务。