文档图像识别技术回顾与展望

来源 :数据与计算发展前沿 | 被引量 : 2次 | 上传用户:biggertree
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]文档图像是一类广泛存在且具有重要应用价值的数据。从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目标。自上世纪50年代以来,文档识别(又称文字识别,OCR)的研究和应用取得了巨大的进展。本文为科研人员和工程人员提供一个比较全面的文档图像识别技术总体介绍,便于大家开展技术创新和技术应用。[方法]本文在介绍文档识别应用背景的基础上,对该领域历史上主要方法进行回顾,对当前技术状况和研究动态进行分析,并展望未来发展趋势。[结果] 1950年代到2000年代,在统计模式识别、特征提取
其他文献
廉租房是我国住房保障体系中针对低收入家庭的主要制度设计。针对廉租房建设和管理的审计,能够及时发现问题,促进被审计单位完善相关规章制度,提高资金使用效益。充分发挥审
微课是一种现代化的教学模式,它主要是以微型视频网络课程为主,以微型教学视频为主要载体,针对某个学科知识点或者教学缓解而设计的一种情境化课程。这种课程目前已经逐渐成
国际银行界风险管理的一个主要特点是广泛使用统计方法和信息技术对风险进行量化管理,特别是在银行零售业务.模型化自动数据分析技术的使用为银行减少风险提供了客观上的可能
城镇居民社会养老保险于2011年7月正式启动后,在老百姓中引起了较大的反应。试点工作还未全面铺开,许多人就开始咨询相关政策及测算何种保险更实惠。 After the social pens
目的了解2008年济源市法定传染病疫情发生水平及流行情况。方法使用中国疾病预防控制中心开发的“国家疾病报告管理信息系统”对济源市2008年法定传染病发病和死亡情况进行统
菜薹因为没有好的雄性不育材料或自交不亲和系,至今尚无一代杂种用于生产,根据拟南芥及白菜型油菜的花药不开裂基因DAD1的保守序列设计引物,扩增菜薹的DAD1基因片段(DAD1F),
静脉留置针作为头皮针的换代产品,能方便迅速地开辟静脉通道,有效地避免了输液过程中液体渗漏等输液意外的发生,又能最大限度地保护患者的血管,已成为临床输液治疗的主要工具
在不同升温速率及与其他污泥不同混合比例条件下,利用热重法对造纸污泥和含工业污水污泥进行了实验研究.结果表明,造纸污泥与含工业污水污泥表现出不同的DTG曲线形式,其中造
[目的]本文研究一种新型仿乌贼水下机器人的系统设计,包括水下机器人机械结构设计和驱动系统设计.[方法]本文建立仿乌贼水下机器人动力学模型、双波动鳍运动学模型以及波动推
MxIrt1是从苹果属植物小金海棠中克隆出的二价阳离子转运膜蛋白基因。为进一步研究该基因的功能,利用MxIrt1基因位于第3和第4跨膜区之间的162bp片段,构建了原核表达载体pGEX-