论文部分内容阅读
身份证号码识别技术蕴藏着巨大的经济价值,它在政府办事部门、酒店入住登记等方面具有非常强的应用背景。虽然每个人的身份证号码由18个数字组成,但是其本质上最多出现10个不同的数字。因为待识别图像清晰度与拍摄环境、设备等因素相关,所以身份证号码识别系统应具有鲁棒性。我们希望识别率达到100%,同时对于使用身份证号码识别系统的用户来说,识别系统也应具有界面友好、操作简单等优点。本文首先介绍了身份证号码识别技术的背景和研究意义;其次讨论了身份证号码识别系统的预处理,包括图像二值化、去噪、定位、分割等。对如何选择合适的二值化阈值以及如何对图像去噪进行了论述;并在数学形态学的基础上,讨论了图像细化、分割算法。最后阐述了图像识别的两种方法:结构方法和统计方法。根据身份证号码的数字特征,在统计方法的基础上,本文提出了一种新的改进方法:基于度序列的身份证号码识别。第一,根据度序列的概念,单个数字可以看成是由简单图构成的;第二,设置一个元素均为1的3×3模板,使模板中心点与待识别图像像素为1的点重合,用给定模板与该像素点的8-邻域所有点进行逻辑“与”运算,然后对模板的结果进行计算,即可得到该点的度数;第三,利用Microsoft Visual Studio 2010版本中MFC平台开发功能和C/C++高级语言程序进行界面设计、算法实现,最终在电脑屏幕上显示身份证号码识别结果。经实验结果表明,该方法的身份证号码识别率在88%以上,具有一定的应用性。新的改进方法的优点是把原始图像数据通过计算机软件产生一组不变量——度序列。由于它不需要存储整个身份证图像,因此在很大程度上降低了计算机的存储空间,同时也保护了个人的隐私。