金融票据版面的自动识别技术研究与原型系统设计

被引量 : 0次 | 上传用户:ahhaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金融票据的自动识别是模式识别的重要应用领域。几乎涉及了模式识别与图像处理的所有重要分支,是一个综合的研究课题,具有理论和实用两方面的价值。本文在收集和分析大量近年来国内外文档图像处理方面的研究报告、学术论文的基础上,对文档图像版面理解所涉及的若干问题进行了深入探讨;着重对文档图像的倾斜校正、版面分析和版面识别进行了研究,并且完成了原型系统的实现,经测试,可以满足要求。主要工作包括:1.对文档图像的预处理进行了研究。文档图像输入时会产生一定的歪斜,文档版面理解和OCR识别算法对文档的倾斜非常敏感,文档图像的倾斜校正十分重要。针对种类繁多、版面复杂的文档,本文对基于整数Bresenham算法求方向投影的倾斜检测方法进行了研究,并与改进的Hough变换方法进行了比较,发现其具有很强的抗干扰性和应用适应性,可以自动进行倾斜调整并且具有较高的可变的精度。2.对表格文档图像的版面结构进行了分析。论文研究了完整的表格结构表示方法,提出了基于表格线段交点为特征的文档类型识别算法。该算法由两个步骤组成:首先是文档图像中表格线段的提取。目前,在图像中提取线段的算法有很多,这些算法各有优缺点。在分析这些算法优缺点的基础上,根据文档图像中线条的特点采用了一个基于线段支持区域的线段检测算法。第二步,在表格线段检测的基础上,根据不同文档有不同几何和拓扑结构这一原理,提出了一种以参数化表格交点为特征点的文档类型匹配算法。3.对表格文档图像的逻辑结构进行了分析,论文提出了一种基于数据域与标题域联系的树形结构表格全局逻辑结构的表示方法,此方法可以很好地将表格的逻辑结构与数据库中表中的数据结构对应起来。并对一种关于表格文件逻辑结构提取的方法进行了研究。此方法主要分为整表的全局划分、局部的逻辑结构分析、整表的再次全局划分和将分析出的各个局部表区用树形结构表示,最后将整个表格用树形结构表示等几个步骤。该方法强调对文件全局和局部布局结构的综合分析,与以往的仅仅从局部上对表格逻辑结构进行确定的方法相比,它具有较高的识别正确率,并可以识别结构更为复杂的表格文件。
其他文献
随着汽车的普及和汽车技术的发展,交通安全问题成为一个社会性问题。频繁的交通事故和巨大的人员伤亡和财产损失,使人们对汽车主动安全性技术和智能交通研究越来越多。经研究
根据加脊喇叭天线的工作原理设计了一种宽带双脊喇叭天线,该天线体积小、频带宽且增益高。依据天线的结构分析了脊波导、喇叭脊结构曲线的相关性质,给出了天线相关参数的确定
2006年4月中北京地区接连出现了强降尘过程。降尘,在地质学家的眼中被视为黄土的原始物质。对降尘过程以及降落物的研究无论对我们正确认识黄土的堆积和演化,或者人类活动对
目的:观察可视喉镜辅助甲状腺位插管对喉返神经(recurrent laryngeal nerve,RLN)监测气管导管定位的影响。方法:择期甲状腺手术患者60例,ASAⅠ-Ⅱ级,随机分为A、B、C三组,其
兰斯顿·休斯是位举足轻重的作家,被誉为“哈莱姆的桂冠诗人”,对20世纪美国黑人民权运动和美国诗歌产生了巨大影响。近些年,休斯的地位日益升高,不仅得到了美国主流文化的承认,而
芹菜素是治疗乳腺炎要药的重要成分,属实际无毒、无遗传毒性的黄酮类化合物,且拥有较好的抗炎作用;针刺治疗疾病安全方便,该法已经广泛应用于炎症疾病的治疗,但是芹菜素或/和
背景:随着大众饮食结构及生活习惯的改变,痛风的患病率呈逐年升高的趋势。痛风一病严重影响着患者的生活质量,西医对本病尚无根治方法,且多伴有明显的毒副作用。随着祖国医学
一、研究背景椎间盘(Intervertebral disc,IVD)是人体重要的组织,由软骨终板,髓核及纤维环三个部分组成。IVD随着年龄的增长会发生不同程度的退变,继发引起多种临床疾病如椎
随着行业的发展,移动通信技术、4G技术的普及,5G技术的不断推进,行业对通信技术专业的学生要求越来越高,再加上嵌入式人才培养的校企合作模式,该文分析了高职通信技术专业课
目的:观察目前槲皮素对骨关节炎动物模型关节液中细胞因子IL-1β、TNF-α水平的影响。方法:将20只新西兰大白兔按照hulth法建立兔膝关节骨关节炎模型,随机等分成4组,每组各5