表格图像的识别及基于XML技术的重建

来源 :第17届全国计算机新科技与计算机教育学术大会 | 被引量 : 0次 | 上传用户:wang540364472
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  二维表格是一种很常见的文档形式,由于其表达信息高度精炼,具有简明、规范、便于填写和处理等优点,被应用于信息领域的各个方面。因此提供一种表格自动处理系统非常具有现实意义。表格一般由一些有一定约束关系的横、竖线,印刷体字符,手写体字符等组成,而表格线的快速、准确提取是表格自动处理的关键。本文实现了一个将表格框线提取,表格图像存储到关系数据库,进而由关系数据模型转换成XML文档的实际应用系统。本文实现的系统可应用于同一页纸上有多个表格的处理。对于表格图像的识别,还提出了一种改进的基于数学形态学的表格框线识别方法。
其他文献
  警卫部队的信息化是警卫部队提高快速反应、协同作战能力的必由之路。本文介绍了警卫指挥调度系统的功能及工作流程,阐述了在该系统开发的过程当中遇到的一些具有代表性技
  随着计算机网络应用的快速发展,解决媒体信息在网络中传送的拥塞控制已经成为一个十分重要的问题。本文基于TCP协议的基础上,提出了一个新的修改方案,用以完善多播协议拥塞
  圆锥曲线密码学是一种新型的公钥密码学,迄今对圆锥曲线上点的描述都是以笛卡尔坐标为基础的。为了简化圆锥曲线的定义和计算过程,本文将有限域Fp上以笛卡尔坐标形式描述
会议
随着经济社会的不断发展和信息产业的突飞猛进,媒体广告业已经成为社会前经济中不可缺少的一部分,在促进经济增长方面发挥着重要作用,对增加产品透明度、宣传产品特性、促进
  IP/DWDM(IP over Dense Wavelength Division Multiplexing)光Internet是下一代互联网NGI(Next Generation Internet)主干网的主要组网技术之一。在IP/DWDM光Internet中,
会议
  就多智能代理技术在基于网络的协作学习支持系统中,学生代理、教师代理、信息代理的基本结构模型进行了探讨。
  移动代理在网络底层信息传输中会存在被窃听和被篡改等风险问题。本文通过引入VPN技术,构建了一个移动代理安全模型,为移动代理在域内传输建立SSL隧道,在跨域传输建立IPsec
  IPv6作为下一代互联网(NGI)协议的标准,其目的是继承、拓展和取代IPv4.未来1~2年间,与CERNET2联通的高校校园网将开始逐渐向IPv6过渡,如何部署新一代校园网是建网之初首要考
采用组培苗繁殖是野生山葡萄种植成功的保证,但大面积推广种植,组培苗往往不够供应,而且价格高,农民难以接受。扦插育苗具有简便易行、生长发育快,移栽成活率高、成本低等优
辽东楤木 (Aralia elata),又名龙牙楤木、刺老鸦、刺龙芽、五郎头、刺嫩芽、树头菜、铁杆刺龙牙、树龙牙,为五加科落叶有刺灌木或小乔木。该种自然分布在我国河北省东北部,辽宁