弯曲书页图像处理方法及在古籍数字化中的应用

被引量 : 0次 | 上传用户:gongshurong20090907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档数字化在日常工作和生活中的应用日趋广泛。非接触式的文档数字化方法如数码照相凭借其设备便携、操作简便、成本低廉、不对原纸质文档造成任何损伤等优势,在文档数字化领域尤其是珍贵古籍的数字化领域的应用日趋广泛。但是在对纸质文档尤其是厚重古籍书页拍照时,书页图像将不可避免的出现一定程度的弯曲变形,必须对其加以矫正,才能进行OCR(Optical CharacterRecognition光学字符识别)、归档等文档数字化的后续工作。本文针对这一问题,提出一种切实高效的弯曲书页图像的图像矫正处理算法。在本文的研究中,详细分析了目前国内外在该领域的各种处理算法,包括将弯曲书页的几何形状建立为规则柱面模型、推广柱面模型、Ruled Surface模型等数学模型,从而找到变形图像上与真实书页上点对点的映射关系的方法;也包括使用CT、投影仪等设备得到弯曲书页变形的深度信息,再通过质量-弹簧模型将其退化为平面的方法。但是这些方法或是受到被矫正页面内容的限制、或是需要大量手工操作、或是依赖于特殊设备,在算法应用的普及性和高效性上存在一定的问题。本文提出一种基于边缘线的三维重构实现弯曲矫正的方法。这种方法将弯曲书页的几何形状建立为具有一定普适性的推广柱面模型,基本原理为首先提取出弯曲书页图像中的书页边缘线;而后根据实际书页高度、拍摄高度、拍摄焦距等简单易得的参数,通过几何成像的理论恢复书页图像中书页边缘的三维形状,从而得到图像上弯曲书页边缘线上任意一点到书页中缝起点的真实距离;进一步在推广的柱面模型上,直接采用简便的直线线性插值方法,得到弯曲书页图像上所有点与真实位置点的映射关系,从而实现矫正。本文的方法所用的特征信息来自页面边缘,不依赖于被矫正页面的内容;仅需要一些基本的拍摄参数,无需手工操作;采用直线线性插值方法即可获得点对点映射关系,运算量很小。本文随后选取一些弯曲古籍书页图像进行了算法实现和实验研究。实验结果表明,本文提出的基于边缘线的三位重构弯曲矫正方法不仅高效快捷,而且能够保证较好的矫正精度,具有一定的实用价值。
其他文献
目的:通过应用脉波指示剂连续心排血量(Pulse indicator Continous Cardiac Output , PiCCO)技术对急性肺损伤/急性呼吸窘迫综合征(acute lung injury/acute respiratory distre
目的:观察工艺变更前后血栓通注射液对实验性大鼠脑缺血-再灌注损伤的保护作用,以及对小鼠凝血时间和胶原蛋白+肾上腺素诱发小鼠体内血栓形成的影响。方法:采用结扎颈总动脉
汉语偏正词组与壮语偏正词组的语序相反,从汉语译成壮语,其对应的表达方式是从"前偏后正"转换成"前正后偏",但由于壮语偏正词组与壮语主谓词组的语序相同,结构形式相同,由此
目的:分析陈皮炮制前后挥发性化学成分的变化,为探讨炮制原理提供实验依据。方法:以水蒸气蒸馏法提取陈皮炮制品中的挥发油,采用GC-MS联用技术对所提取挥发油的化学成分进行
本文对细石器、细石器技术和细石器传统等概念问题进行了梳理、分析。作者赞成细石器是由特殊的工艺技术制成的石制品的观点,并将其范围限定在与此种技术相关的石制品之内。
徐矿集团棚户区改造建设是江苏省委、省政府近年来推进城镇危房改造,改善住房条件的民心工程,也是振兴徐矿老工业基地的一项重要举措。据住房城乡建设部统计显示,目前我国大
对蓝靛果天然红色素的提取、精制实验条件以及化学组分进行了较为系统的研究,为蓝靛果红色素提取和精制实现工业化提供了理论依据。通过实验确定了用乙醇浸提法对蓝靛果红色
随着各种新型技术的有效应用和普及,可通过加强对施工技术的有效管理来不断提高技术的应用效果,最终有效推进我国铁路行业的健康可持续发展。对铁路施工技术管理进行了概述,
分析5例血小板减少性紫癜患者腹腔镜脾切除术后发生肾上腺危象的原因,提出相应的护理对策。发生肾上腺危象的主要原因是长期大量使用肾上腺皮质激素、肾上腺皮质激素减药不当
背景在美国,前列腺癌的发病率位居所有男性肿瘤患者首位,死亡率仅次于肺癌。亚裔中国人中前列腺癌的发病率很低。然而,由于缺乏对此病的早期筛查,大部分的病人诊断时已经有转