发票汉信码的识别算法与实现

被引量 : 0次 | 上传用户:yinleish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现在二维码已经应用于与人类生活密切相关的各个领域。然而一般的二维码都是由国外的一些研究者提出的,这些二维码没有也不会考虑中文汉字的处理,所以很难适用于我国的某些行业的应用。为此,我国提出并开发了具有自主知识产权的二维码——汉信码。汉信码不但能够很好地处理其他二维码所处理的信息,同时大大增强了汉字的处理能力。在汉信码的应用中,某些行业需要通过专用打印机将汉信码打印到纸张上,例如增值税发票上的汉信码。在打印过程中可能由于进纸器的磨损、色带的油墨不适中等原因,打印出来的汉信码会产生扭曲、拉伸、颜色不均等问题。而在识别时,由于使用的又是专用的扫描仪,同样由于进纸器的问题,可能导致二次拉伸、扭曲等。这样扫描后的数字图像用一般的二维码识别技术就很难正确识别。因此,针对这类问题开发一种特别的汉信码识别技术就显得尤为重要。本文主要包括以下几个部分:首先,介绍了汉信码的基本理论和译码规则,二维码的国内外研究现状,本文的研究目的和意义。其次,提出基于OpenCV库对汉信码精确定位的算法,其核心思想是检测矩形轮廓。通过对图像进行形态学的腐蚀与膨胀、坎尼边缘检测、二值化、多边形逼近轮廓等一系列操作,检测矩形轮廓的位置。对于有一定倾斜角度且其它矩形干扰较少的图像,本算法具有较好的正确提取率。再次,提出一种针对增值税发票沿坐标轴方向积分的算法,找到定长区间积分最大值的位置,粗定位码图。一般情况下,打印在发票上的码图可能有一定的倾斜,但是码图边线的斜率会在一个固定的范围内。我们在该范围内选取若干个斜率,然后以该斜率的直线为坐标轴建立直角坐标系,再沿横坐标轴积分,找到纵坐标轴定长区间积分最大值。不同斜率对应不同的积分最大值,其中最大者对应的斜率就是横向的最好斜率。对纵坐标轴也做同样的操作,得到对应的纵向最好斜率。进一步,在横纵最好斜率附近,寻找两斜率乘积最接近-1的斜率,即为最佳斜率。根据求得的最佳斜率,对原始图像作相应的旋转,使码图的边与坐标轴水平。之后,我们应用检测矩形轮廓的算法,精确定位汉信码。最后,对于标准化后的汉信码,首先对码图作直方图均衡化、中值滤波等预处理。接着利用寻像图形、校正图形判断码图是否产生了形变,通过图形变换恢复到理论位置。最后进行网格化,判断模块的灰度属性,最终提取出“0”、“1”数据流。
其他文献
简要介绍了广州城市总体发展概念规划咨询的背景、研究框架、过程及对我们的启示等 ,以期与规划界的同仁们共享。
纳米位移测量技术是现代科技发展的基础和导向,也是重大科学的前沿,国内多位学者已经展开了纳米测量技术的相关研究。纳米直线位移传感器是现代工业、国防军工等特殊需求的核心
本文从儿童写作心理出发,以小学生写作心理为例,从想写——激发与维持学生写作动机、能写——写作能力结构的培养、会写——培养学生写作的创造力这三大方面,来阐述作文辅导
莎士比亚戏剧作为英国社会的百科全书,以其极高的艺术成就和对国家文化的代表力,成为英国重要的文化符号,影响力波及世界各地。中国同样拥有艺术价值和文化价值并重的传统戏
沿海地区海塘是一种重要的社会基础设施,具有防御风浪和海潮等作用,是防止风暴潮侵袭陆地的屏障。浙江沿海地区软土基础地质条件复杂,经多年运行后,海塘暴露出堤顶高程不足、
延安时期文艺意识形态批评模式在中国共产党对文艺知识分子进行管理、对文艺思想进行建构的背景下形成。毛泽东《在延安文艺座谈会上的讲话》要求文艺批评"政治标准第一、艺
当前我国导游生存环境存在诸多问题,致使导游素质低下、人员流失严重、导游服务质量问题严重。笔者认为,应从旅游行政管理部门、旅行社、导游公司、社会、导游自身等多方面优化
声矢量传感器(Acoustic Vector Sensor,AVS)技术可应用在通信定位、声呐、故障源定位、雷达以及生物医学等众多的国民经济以及军事国防领域,同时声矢量传感器能够同步共点地测
图坦卡蒙虽然不是古埃及历史上在位时间最久的,却是最最最神秘的一位法老。因为在他陵墓中有一句超级灵验的诅咒:"谁扰乱了法老的安宁,‘死神之翼’就将在他头上降临。"考古
卵巢癌是妇科常见的恶性肿瘤之一。卵巢癌早期诊断困难,一旦确诊卵巢癌,75%患者已是中晚期。目前国际上比较公认的卵巢癌化疗为紫杉醇联合铂类,但原发耐药和在治疗中产生的多