基于表格识别的选举模式自动生成算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:navigate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前的社区选举活动中,选举模式的生成以人工制作为主,在短时间、大批量上会服务时,人工操作繁琐,模式制作过于耗时且易出错。因此,研究一种自动识别选票图样并自动生成选举模式的算法具有重要的意义。论文提出对社区选票图样进行处理和识别,提取选票图像中的表格框线,对选票表格的几何结构进行描述,结合社区选票的版面特征,生成选举模式。  选票图像的识别离不开图像的预处理,图像预处理主要包括图像二值化和倾斜检测与校正。对于图像的二值化处理,本文研究了直方图分割法、一维大津法与改进的二维大津法,并简要介绍了局部阈值分割法的概念和应用。针对社区选票图像的特点,实验采用一维大津法,获得了良好的处理效果。介绍了基于Hough变换的图像倾斜检测算法和一种通过投影检测直线的算法,比较了旋转校正和线性搬移两种倾斜校正算法的优劣。  表格框线的检测是描述表格几何结构的基础,基于Hough变换这种古老的方法同样可以用于表格框线的检测,但运算量巨大,同时确定框线端点十分困难,搜索法是一种更加简明的方法,但抗图像倾斜能力差。基于有向单连通链和表格线游程的矢量化算法在表格框线检测的应用中更加突出。本文着重研究了基于游程的算法,并提出一种基于游程聚类的框线检测算法,经过理论分析和实验证明,这种算法具备误识率低、鲁棒性强、抗表格线断裂等多种优点。  表格的结构描述就是对表格子区域和单元格的层次关系进行表示,本文首先介绍了单元格顺序编号的方法和整体局部描述树的数据结构,分别指出它们在选票几何结构的表达中存在的问题和不足,然后介绍了选举模式的基本概念,指出X-Y树结构能够有效地描述选票的版面特征,在此基础上定义了选票候选区域和候选单元的概念,提出一种模式自动生成算法,通过实验证明该算法能够正确生成选举模式。最后介绍了设计开发的模式生成软件及其应用场景。
其他文献
随着三维建模技术的不断提高和虚拟现实技术的深入发展,三维技术已经逐渐成为各个研究领域的新宠儿。在网络上,涌现了海量的三维模型,各种三维搜索引擎也相继问世。由于三维
航拍图像是运用航空手段、遥感技术等进行拍摄的反映地表形态的数据,而作为分析手段的航拍图像处理技术,被广泛运用于军事国防、交通建设、水利工程、生态研究、城市规划等领
生物特征识别技术因为具有安全性、稳定性和便捷性等特点,被广泛地应用于身份鉴别领域。常用于识别的生物特征包括指纹、人脸、声纹、虹膜、视网膜、掌形、签名、掌纹等。由
计算机立体显示技术能使二维平面设备展现具有深度层次的立体视觉效果,它是虚拟现实的关键技术之一,也是一个基本的虚拟现实系统必须具备的条件。本文从立体知觉出发,研究立
词汇语义知识库是语义分析的基础,目前词汇语义知识库构建仍是基于手工的方法。本文分析了HNC、HowNet和CCD语义词典的来源、对概念的描述体系和词典的组织结构,阐述了三者在
流数据挖掘中的一项重要任务就是挖掘序列模式,其目的是在流数据中挖掘出所有满足最小支持度的频繁序列。流数据中序列模式的挖掘的应用十分广泛,包括网络流量访问日志分析,w
教学的科学性依赖于对学习过程的深入理解,研究人类概念学习过程对提高教学的效率和效果起着重要作用。定义性概念是具体学科教材知识的基本单位,定义性概念的学习是具体学科
2009年我国的3G网络正式在市场上投入使用,原本因2G时代网络速度缓慢而无法大规模普及的移动互联网应用的数量快速增长,很多嵌入式系统设备也向移动信息终端、应用终端转变。
现代GPU计算能力的快速增长,使得它越来越适合于大规模问题的计算。CUDA(Compute Unified Device Architecture,统一计算设备架构)技术是一种将GPU作为数据并行计算设备的软
近年来医学技术和骨科临床医学紧密结合,极大的促进了骨科临床诊疗技术的发展。针对不同的骨科疾病,通过医学图像处理极大程度提高了手术治疗的准确性和安全性。有限元分析是