图书馆藏书索书号自动识别中关键技术的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:suny112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图书馆中的每本图书都有一个索书号,它能准确地确定图书在书架上的排列位置。但是,图书经常会被放错位置,致使读者无法找到这些图书,严重影响图书的管理工作。目前依靠人工纠错,由于馆藏图书数量大,借阅的人数多,人工检测错放图书的工作量非常大。本文采用索书号自动识别的技术自动检查、找出错放的图书。本课题由上海交通大学图书馆提出。 虽然文字识别技术已在众多不同领域得到应用,如汽车牌照识别,邮政编码识别以及视频图像中的文字识别等,但有关图书索书号文字识别的研究和文献却是至今未见报道。由于图像易受环境影响,因此不同领域的图像差别很大,其所需解决的问题也各不相同。索书号图像存在的主要问题如下:(1)光照条件无法控制;(2)索书号与其他文字,如出版社、书名等混合在一起;(3)墨汁、污迹等污染严重;(4)长时间的使用,索书号存在不同程度的褪色;(5)有的索书号中存在残缺字符。针对上述问题,本文对图书索书号识别中的几个关键技术进行了全面的研究。 在图像中的文字定位和分割技术方面,首先提出了基于文字笔画宽度的文字边缘点滤波算法。该算法利用相邻边缘点距离统计检测笔画宽度,根据同一文字区域的文字笔画宽度相近的特点进行边缘点滤波。实验表明,该滤波算法能有效抑制背景的干扰,解决基于边缘点数量统计的文字分割算法易受背景干扰的问题,从而改善其文字分割算法性能。其次,提出将纹理和连通域特征相结合的文字分割方法,使得基于纹理特征和连通域特征文字分割方法的优缺点能够相互弥补。结合上述提出的文字边缘点滤波方法,利用边缘纹理特征实现文字的粗定位。然后,利用文字连通域特征实现文字区域的校验和细定位。该算法的文字区域检测率达到了91.47﹪,错检率为9.63﹪。最后,在索书号的定位和分割中,提出了基于梯度差的文字笔画模型。该模型能有效克服索书号存在墨汁、污垢和光照较暗的问题,检测出文字像素点,文字像素点形成连通域,经连通域滤波、合并后形成文字区域。利用MLP神经网络从中选出真正的索书号字符区域。算法的索书号检测率接近96﹪,错检率接近3﹪,漏检率为1﹪。 在文字图像的二值化处理方面,提出了利用文字笔画模型进行初始二值化,在此基础上检测笔画宽度,并根据笔画宽度自适应地调整局部区域大小和局部阈值的二值化方法。实验结果表明,该方法能克服光照变化、墨汁污染和褪色等的影响,保持文字笔画的连续性和完整性。 在粘连字符的切分方面,分析了二值化后的索书号粘连字符的笔画粘连和切分对笔画变形的影响,提出了基于上下凹凸轮廓检测的粘连字符切分方法,并根据切分处2个笔画的宽度比,对切分后的笔画变形进行了修复。对索书号的粘连字符切分实验表明,正确率达到了93﹪。 在残缺字符识别方面,提出了分解文字轮廓后,提取轮廓的宽度统计特征和突变、竖、左斜、右斜、圆弧等结构特征。运用粗糙集理论的知识约简,选择特征,建立字符识别的最简决策规则,采用结构语句识别方法识别残缺数字字符。实验表明,该方法对残缺和完整数字字符的识别正确率分别为91.8﹪和97.6﹪。 图书索书号自动识别中关键技术的研究解决了错放图书的检测问题,开拓了文字识别技术应用的又一新领域,同时丰富了图像分割和识别的理论。
其他文献
当前,我国的脱贫攻坚行动正值关键时期,其中农村金融扶贫工作有待完善.区块链技术作为一项跨时代的新兴技术,能够打破传统农村金融扶贫方式的瓶颈,但是也遇到了一些问题.本文
本论文分析了死区对逆变器性能的影响,提出了一种通过延长死区时间来提高电流反馈型补偿方式中的检测精度,并达到改善逆变器输出电流质量的目的的新方法。本论文对交流调速
近年来,随着列车运行速度的大幅度提高,铁道部对高速列车运行中的多次事故进行分析后,认为列车的超偏载是引发列车脱轨的主要因素,从而对列车超偏载的监测工作日益加强。因此,能在
本文研究了大连模具工业的发展情况,目的在于寻求快速发展大连市模具工业的有效路径.文中以宁波为比较分析城市,采用实证分析方法,从综合实力、固定资产投资、财政实力、对外
多自由度超声电机是一种新型的特种电机,具有结构简单、集成度高、小型轻量、断电自锁、不受电磁干扰、多维驱动输出等优点,利用逆压电效应、机械振动、摩擦耦合来转换能量。本文所要研究的是一种具有工程应用价值的多自由度超声电机,由机械结构与电路驱动一体化集成,实现复杂的运动输出。概括起来,主要研究内容包括以下几个方面:设计了一种锥型结构的多自由度超声电机。电机定子采用单足驱动方式,利用四分区的叠层式压电陶瓷
本文对连铸结晶器液位控制提出一种模糊自适应整定PID控制方法。这种方法是在常规PID控制器的基础上,以误差e和误差变化率ec作为输入,采用模糊推理方法对PID参数kp、ki和kd进行
扑翼运动学和机翼柔性变形是影响微型扑翼飞行器飞行性能的两个重要因素。但是,研究者们大多关注扑翼运动学机构的实现,忽略了机翼柔性变形的研究。自然界昆虫翅膀的柔性变形是
本文通过对荣华二采区10
期刊
随着知识经济时代的到来,人们对于企业经济管理的重视程度也在不断增加,企业经济管理对于企业未来的发展具有至关重要的作用,所以在当下市场经济的大背景下,如何增强企业经济
本文设计并建立了一套完整的专用弯管模拟系统,用于对大型弯管冷成形进行有限元数值模拟,正确预测了弯管椭圆度、减薄率、回弹量等质量参数,以及设备驱动力;分析了影响弯管质