中文版面分析和重构

来源 :沈阳建筑大学学报(自然科学版) | 被引量 : 0次 | 上传用户：zhhaibin

【摘要】

：

目的在将纸张文档数字化的过程中，解决中文文档版面信息的自动提取与恢复问题．方法通过搜索连通域，并根据连通域的尺寸特征，优先提取非文本区域，对提取出来的非文本区域，根据投影直

【作者】

：

钟辉孙士兰刘倩

【机构】

：

沈阳建筑大学信息与控制工程学院

【出处】

：

沈阳建筑大学学报(自然科学版)

【发表日期】

：

2008年2期

【关键词】

：

版面分析版面理解版面重构 XML

【基金项目】

：

辽宁省自然科学基金项目(20052006)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目的在将纸张文档数字化的过程中，解决中文文档版面信息的自动提取与恢复问题．方法通过搜索连通域，并根据连通域的尺寸特征，优先提取非文本区域，对提取出来的非文本区域，根据投影直方图、宽高比和黑白像素比等特征区分出表格、直线和图像；对文本区域采用改进的基于投影的纵横切割法来达到对文本正确分割的目的；利用XML文档文件格式描述、组织、恢复原有版面的数据和样式．通过重构生成保持原版面格式的通用电子文档．达到“原文重现”的目的．结果对大量的书籍样张和带表格、图像以及横竖混排等复杂样张的试验，结果表明改进的版面分析方法

其他文献

基于微博的图书馆社会化媒体营销研究

微博作为一种新型的社会化媒体营销工具,提供了一个用户直接参与交流的平台。以新浪微博为例,介绍图书馆如何构建微博平台,探讨微博在图书馆信息发布、参考咨询、创建用户交

期刊

微博社会化媒体营销图书馆

铝合金薄壁散热片零件加工工艺改进

以一种典型的铝合金薄壁散热片零件为试验研究对象，分析该类零件的加工难点，从改进工装结构保证工装实体与零件薄壁部位完全贴合来增强刚度，改进工装结构保证工装平面与零件平面

期刊

铝合金薄壁散热片零件加工工艺变形震颤

盛夏湿地“水凤凰”

<正>水雉是鸻形目水雉科的一种中小型鸟类(与鸥、鸻鹬类亲缘关系更近,不要与鹤形目秧鸡科的鸟类搞混),在我国主要繁殖于长江流域及南方各省,栖息在富有挺水植物和漂浮植物的

期刊

繁殖季节繁殖期

血必净注射液对脓毒症所致急性肾损伤的内皮保护作用

目的探讨血必净注射液对脓毒症所致急性肾损伤（AKI）的内皮及细胞外基质的保护作用,为临床提供新的治疗思路。方法健康雄性SD大鼠30只,随机分为假手术组（Sham组）、生理盐水组（NS组）

期刊

脓毒症急性肾损伤内皮素-1诱导型一氧化氮合酶基质金属蛋白酶9金属蛋白酶1组织抑制剂

论鱼塘建构对文化生态的支撑功能——基于对贵州黄岗侗族社区的思考

在侗族传统村寨的整个结构当中,鱼塘扮演着极为关键的角色。人为建构起来的鱼塘次生生态系统之所以能够获得侗族乡民的喜爱,原因是多方面的。一方面,鱼塘自身存在着诸多的生

期刊

文化生态支撑功能侗族社区鱼塘

大田县农村生活污水治理对策

近年来农村发展管理越来越受到重视,农村生活污水排放和处理问题一直都是影响农村环境、居民幸福度的关键要素,同时也制约了农村发展.文章重点以大田县农村生活污水治理工作

期刊

农村水环境生活污水治理对策

试论《古今集》与《新古今集》风物诗表现手法之差别

试论《古今集》与《新古今集》风物诗表现手法之差别大连外国语学院副教授刘利国《古今集》和《新古今集》是日本古代文坛继《万叶集》之后的又两部优秀歌集。顾明思义，《新古

期刊

古今集大连外国语学院《古今集》编选者

城市哲学研究的空间转向与方法论反思——第五届“城市哲学论坛”会议综述

由苏州大学哲学系和《江海学刊》杂志社共同主办、苏州大学东吴哲学研究所承办的＂第五届‘城市哲学’论坛——当代城市空间拓展中的主体性迷思＂学术研讨会于2015年10月31日~11

期刊

空间转向城市哲学列斐伏尔哲学研究马克思主义方法论反思第五届会议综述

采用基因拼接方法构建人源特异性抗乙型肝炎病毒表面抗原Fab噬菌体抗体库

目的　构建人源特异性抗乙型肝炎病毒表面抗原Fab噬菌体抗体库。方法　从抗乙型肝炎病毒表面抗体高滴度 (1:10 2 4 )的人全血中分离外周血单个核细胞 (PBMC) ,经RT PCR分别扩

期刊

基因拼接Fab噬菌体抗体库乙型肝炎病毒表面抗原

天麻素注射液防治甲状腺手术体位综合征124例

目的：探讨天麻素注射液防治甲状腺手术体位综合征的疗效。方法：将248例甲状腺癌手术患者随机分为2组，A组124例术后常规治疗，B组124例术后给予天麻素注射液，观察术后48h内出现头痛

期刊

天麻素注射液甲状腺手术体位综合征预防治疗

中文版面分析和重构

与本文相关的学术论文