论文部分内容阅读
当前的社区选举活动中,选举模式的生成以人工制作为主,在短时间、大批量上会服务时,人工操作繁琐,模式制作过于耗时且易出错。因此,研究一种自动识别选票图样并自动生成选举模式的算法具有重要的意义。论文提出对社区选票图样进行处理和识别,提取选票图像中的表格框线,对选票表格的几何结构进行描述,结合社区选票的版面特征,生成选举模式。 选票图像的识别离不开图像的预处理,图像预处理主要包括图像二值化和倾斜检测与校正。对于图像的二值化处理,本文研究了直方图分割法、一维大津法与改进的二维大津法,并简要介绍了局部阈值分割法的概念和应用。针对社区选票图像的特点,实验采用一维大津法,获得了良好的处理效果。介绍了基于Hough变换的图像倾斜检测算法和一种通过投影检测直线的算法,比较了旋转校正和线性搬移两种倾斜校正算法的优劣。 表格框线的检测是描述表格几何结构的基础,基于Hough变换这种古老的方法同样可以用于表格框线的检测,但运算量巨大,同时确定框线端点十分困难,搜索法是一种更加简明的方法,但抗图像倾斜能力差。基于有向单连通链和表格线游程的矢量化算法在表格框线检测的应用中更加突出。本文着重研究了基于游程的算法,并提出一种基于游程聚类的框线检测算法,经过理论分析和实验证明,这种算法具备误识率低、鲁棒性强、抗表格线断裂等多种优点。 表格的结构描述就是对表格子区域和单元格的层次关系进行表示,本文首先介绍了单元格顺序编号的方法和整体局部描述树的数据结构,分别指出它们在选票几何结构的表达中存在的问题和不足,然后介绍了选举模式的基本概念,指出X-Y树结构能够有效地描述选票的版面特征,在此基础上定义了选票候选区域和候选单元的概念,提出一种模式自动生成算法,通过实验证明该算法能够正确生成选举模式。最后介绍了设计开发的模式生成软件及其应用场景。