基于三维数据的扭曲文档矫正技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:zhangliye5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当我们使用数字相机采集文本图像时,自然场景中的书本在图像中往往存在三维透视形变,而且这种形变对于文字信息的提取,特别是对后期的计算机OCR(Optical Character Recognition)产生非常大干扰。为了解决自然场景中的这个难题,本课题通过深入研究提出一种基于三维数据的扭曲恢复方法。本课题算法从三维点数据出发,运用三维扫描仪采集书本的三维模型信息,经过本文方法处理,基本上可以完成有书本自身厚度引发的文字视觉扭曲还原,恢复出书页辗平的逆向效果。本文首先介绍了目前文本形式的图像扭曲矫正算法的大体情况,从维度上说,可以分为二维算法和三维算法。然后研究当前主流二维算法和三维算法的优缺点,通过对比分析并提出了一种基于三维数据的扭曲文本图像校正算法的研究思路。然后,本课题详细讲解了三维书本模型和三维纹理的知识点以及处理办法。三维书本模型样本是运用eva扫描仪扫描书本水平平摊桌面上的情况。完成采集后再将纹理图片与三维网格顶点数据相对应上,最终达到书本弯曲矫正。随后,按顺序对采集到的弯曲模型做预处理工作,空间Z轴方向校正,曲面微分,计算XY平面的曲面拉伸系数,三维倾斜平面坐标到二维平面坐标的映射转换,辗平后的多个小平面的拼接。预处理可以去除页面边缘点运数据中的边缘噪点,空间Z轴方向校正有利于后期坐标变换,利用微分将曲面近似为平面,通过对每个微分后的小曲面进行拉伸辗平,最后对它们做拼接处理,从而达到页面扭曲恢复的效果。最后,根据本文算法设计并实现了本文的三维扭曲恢复算法。通过试验数据对比结果表明,本文算法可以在书本正常平放状态下有效辗平书籍处的扭曲。
其他文献
通过例证说明误差理论在设计性物理实验中从始至终起着非常重要的作用,既可以有效的提高实验效率,又可以增强实验的准确性、合理性和科学性.
中医药长期积累的临床经验中蕴藏着整体观念、辨证论治的精华,但在循证医学的背景下难以提供多中心随机对照双盲临床研究的数据。在全球大数据时代的背景下,中医药临床的数据
The year 1400 opened with more peacefulness than usual in England. Only a few months before, Richard Ⅱ weak, wicked,and treacherous-had been deposed(废黜), and
期刊
本期我们继续刊载英语中的形似词  1.construction,destruction,instruction,obstruction  [例句]Fascism cannot save capitalism,but only hastens its___.……
期刊
为了解种植模式对谢君魔芋(Amorphophallusxiei)光合作用的影响,研究了间作和净作模式下谢君魔芋的光合作用和光合诱导特征。结果表明,间作模式下的谢君魔芋净光合速率(Pn)比净
分析讨论了生物接触氧化过滤处理生活污水过程中的有机物降解机理,研究了该反应器的流态特征,推导出了该反应器处理生活污水的动力学模型,通过动力学实验并利用作图法求得反
现如今财务会计正逐渐转变为管理会计,因此会计行业也会需要更多的共享服务,另外很多企业也会将会计业务外包出去,这是被理论界和实务界所广泛认可的思想。企业是会计人才的
事业单位是我国重要的公共部门,承担着全社会的文化教育、科学研究、技术进步、医疗保健、文化娱乐等多方面任务,其财务控制水平和效果,将直接影响公共资金的使用效益,影响国
《荒野的呼唤》是美国作家杰克.伦敦最著名的小说之一。作品借巴克狗的经历和回归荒野的结局,表达了杰克·伦敦对文明社会的失望和对荒野的赞叹。巴克身上倾注了杰克·