基于OCR的调查问卷自动识别统计分析系统的开发与设计

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:chenjiechn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,大部分的调查问卷都是以人工的方式进行数据的统计和分析。当前随着计算机技术的飞速发展,利用计算机技术对调查问卷图像进行识别统计分析已经成为了一种必然趋势。尽管在邮件分拣、银行票据分析、选票统计等应用领域已存在一些基于OCR技术的专用软件系统,但由于调查问卷版面固定、通用性差等特点,使得在实现自动识别方面是存在一定的问题。特别是在识别后的可视化方面,当前研究还不够深入。本文以调查问卷为研究对象重点研究调查问卷的识别统计技术,包括调查问卷版面结构的定义、识别区域的选择以及可视化显示。通过用户定义的调查问卷的描述文件,结合问卷固有信息进行问卷的自动识别统计,对于识别后的数据信息进行可视化显示。在获取调查问卷识别内容的过程中提出利用XML技术作为桥梁实现问卷信息由层次化、半结构化的XML数据转化为关系数据。由于进行识别扫描的图像前要进行图像的倾斜矫正而针对此问题提出在问卷描述文件中定制其特殊点通过其模式匹配实现图像的倾斜矫正。同时对于部分问卷图像的倾斜矫正则利用基于连通区域以及文字行之间的距离固定文字行较长的特点进行倾斜矫正。在XML进行映射生成识别所需内容的过程中主要利用其相关节点集的概念,通过节点直接映射完成由层次半结构化数据到关系数据的转化。调查问卷中的手写内容,则是利用其交截特征和孔洞特征等进行字符的识别。在其识别后利用平行坐标系进行多维数据的可视化显示。对于问卷信息利用平行坐标系进行显示信息重复率高的问题,给出随机扰动公式,对重复信息进行离散处理,最后进行聚类分析划分群组。对于划分后的群组利用刷技术进行不同群组的显示。利用上述研究初步实现了基于OCR调查问卷的识别统计分析系统。
其他文献
我国“一带一路”倡议深入发展,但国内工业化和城镇化建设尚未完成,为装载机的发展提供了更加广阔的空间。装载机的使用寿命一直是人们研究的方向。受时间、测试成本等影响,
目的:对比行PCI术的房颤患者应用华法林与达比加群联合PCI术后双抗的效果。方法:掷币法将85例冠心病合并房颤患者分为两组,均行PCI术,并接受常规抗凝和抗血小板标准双联等治
目的观察硝酸异山梨酯联合环磷腺苷葡胺治疗老年心绞痛患者的临床疗效及药物不良反应,为临床老年心绞痛患者治疗方案的选择提供参考。方法选取我院收治的90例老年心绞痛患者,
目的:分析棘突间融合钢板治疗单节段退变性腰椎管狭窄症的临床疗效。方法:选取我科2017年12月—2018年12月采用棘突间融合钢板治疗单节段退变性腰椎管狭窄症(L 4/5)患者23例
我国科技技术水平的不断提升,为提高我国电力系统整体配置提供了强有力的技术支撑。经济高速发展,城市化水平不断提高,要求城市配电网建设也应与时俱进跟上城市发展的步伐。
目的研究应用气管提拉技术对气管插管患者置入鼻饲管的方法,以减少下鼻饲管对患者造成的不良刺激,为临床护理提供可靠资料。方法将我院ICU自2012年3月至2015年7月收治的有意
为建立有效的安全防控机制和集成化的风险评估管理系统,借助安全可靠性数据的数据联邦技术,PHAMS系统建立了基于保护层关联的装置动态风险分析、安全仪表智能定级验证技术与
目的评估3D打印主动脉夹层模型在血管外科住院医生教学中的应用效果。方法将2017年9月至2018年9月40名在四川大学华西医院血管外科进行学习的住院医师分为对照组(传统教学组,
目的探讨系统化康复护理在老年股骨颈骨折人工骨头置换术围手术期的应用效果。方法选取2013年9月至2017年9月我院骨科接诊的75例股骨颈骨折行人工股骨头置换术的患者作为研究
蒋平阶身处惊世巨变之时,先以云间词派代表人物出名,随后入仕抗清,终究避世隐逸。其人擅于诗词,又深谙地学,交游亦极为广博,大致可分为文学师友、抗清同仁、玄学道友等三类;