扫描古籍图像透背去除算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:bgydong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
古籍,是指未采用现代印刷技术印制的书籍,具有重要的文献考古价值。古籍的数字化可以真实且清晰地反映古籍原貌,在信息传播和利用上具有极大优势。古籍数字化在提供古籍字符信息的同时,也应当向使用者提供质量可靠的古籍图像信息,然而古籍文本由于年代久远或保存不当,图像质量下降严重,所以古籍图像修复成为了古籍数字化中的重要问题。对于古籍文本的扫描图像而言,透背问题尤为重要。透背现象是指一种图像质量衰减现象,往往是由于墨水从纸张的正面渗透到反面,从而影响了文本的阅读。如何实现扫描古籍图像的透背去除,成为古籍图像数字化过程中一个越来越重要的课题。本文围绕如何快速有效地去除扫描古籍图像中透背部分的问题展开研究。论文介绍了国内外扫描古籍图像透背去除算法的研究现状,并在现有透背去除算法的基础上,分别提出了基于支持向量机(Support Vector Machine, SVM)的扫描古籍图像透背非盲去除方法和全局与局部特征相结合的扫描古籍图像透背盲去除方法。本文的主要研究内容如下:1.在扫描古籍图像的信息提取方面,对现有的图像特征提取算法进行分析研究,提出了一种基于高斯混合模型(Gaussian Mixture Model, GMM)的图像全局特征提取方法。根据扫描古籍图像的图像内容特点和像素灰度级分布特点,通过对图像建立高斯混合模型,并根据图像的高斯混合模型中的参数,提取出图像特征。2.在扫描古籍图像透背非盲去除方面,提出了一种基于支持向量机的扫描古籍图像透背非盲去除方法。该算法对配准后的扫描古籍图像对进行K-means初始聚类,根据双面图像特点,随机选择训练样本并训练SVM分类器,利用训练好的SVM分类器对图像进行细致分类,最后根据分类结果对透背区域进行修复,得到无透背的扫描古籍图象。该方法运算简单,能够较好的满足非盲去除要求。3.在扫描古籍图像透背盲去除方面,本文主要分析了全局和局部特征对透背去除效果的影响,提出了一种基于全局和局部特征的扫描古籍图像透背盲去除方法。该方法首先通过图像的高斯混合模型中的参数提取图像的全局特征,然后结合图像的局部特征,利用基于极限学习机(Extreme Learning Machine, ELM)的分类器对这些特征进行训练与学习,获得图像中的透背区域,最后对透背区域进行图像修复。该方法在不同测试图像上都可以有效去除透背部分,有较强的鲁棒性。
其他文献
传感器网络具有布线成本低、监测精度高、容错性好、可远程监控、便于诊断与维护等众多优点,在军事、生态环境保护、工程监测和医疗卫生等领域有着广阔的应用前景。但是,传感器
学位
针对高炉内部环境复杂,其物理、化学、动力学过程难以确定,料面温度分布形态多样,难以直接建立准确的料面温度场模型的问题,本文从工艺机理的角度分析了高炉红外图像、十字测
数字农业是计算机技术在农业领域的应用,其中虚拟植物是重要研究内容之一。水稻作为主要的农作物,关系到国民经济命脉,研究水稻虚拟生长对便于水稻种植管理、缩短水稻新品种培育
在实际系统中,执行器元件直接作用于被控对象,是系统中不可或缺的部分。由于受到物理限制,执行器元件的输出往往是有界的,通常可以用饱和非线性描述这一物理现象。饱和往往会导致
射线数字成像是当前射线检测、诊断技术发展的重要方向,图像去噪是提高射线成像检测灵敏度和分辨率的关键。本文针对X射线图像的特性,研究如何利用小波变换去除X射线图像中的噪
三维网络游戏已经成为一种非常流行的休闲娱乐方式,玩家可以在完全不同于现实生活的虚拟世界中获得乐趣。网络游戏服务器是这个虚拟世界的载体,所以,服务器的性能直接影响玩
光谱仪在PC机的控制下可以快速、直观、实时在线的对物质进行测量分析,而在室外,尤其是野外条件下则不便于检测操作,使光谱仪的应用受到限制。利用嵌入式系统设计的方法,可以实现
支持向量机具有全局最优、结构简单、推广能力强等优点,是机器学习和模式识别领域的研究热点之一。近年提出的各种动态支持向量机方法,一定程度上解决了新信息对模型的影响,
本文对多功能测控系统进行了研究和设计。本测控系统能够对水进行恒温控制、对液位和压力进行监测,并能对当前所测得的值进行实时显示。本系统按照标准工业现场要求进行设计