复杂多场景文档版面分析方法的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:airbike
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档版面分析是一种对文档的结构进行拆解、分析和理解的一项基本文档图像处理技术。该技术在人机交互、文档智能化理解、机器翻译等领域有重要的需求,是模式识别与文档理解领域的热门研究方向。现实生活中的文档种类繁多,包括杂志书本、古籍文档、票据文档、图表文档和手写文档等,不同类型的文档特点不同,应用场景也不同,因而对其进行版面分析的任务和目标也不同。针对复杂多场景的文档版面分析任务,研究的主要挑战是要处理种类繁多的文档,并且现实场景中的文档往往还有图片质量低下、外观变形、排版自由等问题。为了解决复杂多场景的文档版面分析问题,本文主要从数据集和算法设计两个角度出发进行了相关研究。本文的创新和主要工作总结如下:(1)针对目前真实场景下手写文档数据集的稀缺问题,本文构建并公开了首个自然拍照手写数据集SCUT-HCCDoc。拍照场景下的文档图片样式更加多样,手写文本样式更加丰富,对于研究现实场景的手写文档分析识别具有重要意义。本文从图片、文本、字符三个层次上分析了SCUT-HCCDoc数据的多样性,并给出了手写文本检测、识别、端到端识别三种任务上几种主流方法的基准实验结果。实验结果验证了SCUT-HCCDoc数据的多样性,以及拍照手写文档分析识别任务的挑战性。(2)针对目前已有文档版面分割方法只能针对某一种类型的文档,以及在复杂文档上性能较差的问题,本文提出了一种可以解决包括杂志、古籍、拍照和手写等场景下文档的页面级、区域级、笔画级分割任务的版面分析新方法DADSeg。该方法基于语义分割(Semantic Segmentation)的思路设计,结合了可变形注意力机制和Transformer编码器结构,不仅在分割精度上取得了一定的提升,还能适应多种分割任务。(3)针对已有方法在复杂图表文档分析任务上的不足,本文提出了一种图表文档面板分析方法De Match。De Match结合了目标检测模型、关键点分割模型,以及基于矩形拓展和基于最高交并比(Intersection Over Union,Io U)的图表面板元素与文本匹配模块,可以适用于直方图、折线图、散点图等多种常见的图表文档的面板分析理解任务。综上所述,本文的工作主要围绕手写文档、杂志、古籍文档和图表文档在内的复杂多场景文档的版面分析展开研究,完善了相关文档数据集,并提出了相关新方法。
其他文献
中国公路桥梁建设规模巨大,随着时间的推移,有很大比例路桥结构已经步入了老龄化阶段,破损现象日趋严重,对在役桥梁进行检测维修和养护管理已引起业界和学术界的广泛关注。然而,目前对桥梁的常规检测大多依赖于人工进行,耗时费力,且存在一定的危险性。为了规避现有检测方法存在的诸多弊端,满足现代检测模式智能化和准确性的需求,本文提出了一种基于深度卷积神经网络的桥梁裂缝检测模型。该模型适用于无人机成像的桥梁裂缝检
学位
截止目前,多功能高效电磁控制仍然是一个永恒的话题,涵盖从可见光到微波以下的波段。作为平面或二维(2D)超材料,具有深亚波长厚度的超表面近十年来被用于几乎任意电磁调控中,并因其超薄特性利于紧凑架构的光电集成。与传统光子器件不同,超表面旨在通过周期性或随机分布的亚波长亚原子,例如纳米棒、纳米光栅、纳米梯形、悬链线、LC谐振单元、开口谐振环等,以逐像素的方式调节入射光振幅、相位和偏振态,引入可控的局部相
学位
在经济以及科技的快速发展环境下,企业尤其集团公司需要顺应趋势发展,把握机会,调整结构,在新趋势下探索适合自己企业的发展道路,积极加大创新发展是企业应对新变化的必由之路。但在新环境下,企业难以凭借自身进行创新,企业需要打破行业边界进行创新。开放式创新成为了企业创新的战略选择,在生态圈中企业通过发挥各自优势,整合资源,合作共赢的方式,促进企业的创新转型。近年来有些企业运用开放式创新模式,在一定程度上提
学位
生态网络识别是保障区域国家生态安全、维持区域生态系统连通性、确保区域生态功能实现可持续发展的重要途径之一。而目前传统生态网络构建大多从单一景观格局要素识别生态网络,缺乏对生态过程的考量,综合生态功能与形态结构识别生态网络的研究较为欠缺,景观生态学下跨学科的技术方法为传统生态网络体系的优化完善提供了新视角。本研究以粤港澳大湾区为例,利用In VEST模型对区域主要生态系统服务进行了评估,结合Geo
学位
随着社会的快速发展,不可再生能源消耗与日俱增,引起严重的环境问题。受全球变暖的影响,制冷能耗在社会能源消费中占比显著。因此,降低制冷系统压缩功以减少电能消耗具有切实意义。在节能技术当中,通过低品位热能降低制冷系统压缩功的热功复合驱动制冷系统受到了极大的关注。然而,现有的优化模型却不一定导向节能量最大的方案。此外,工程应用以中等规模热源数量为主,其与现有热功复合驱动制冷系统的匹配性差。基于此,本论文
学位
工程水泥基复合材料(ECC)是为了克服传统水泥基材料的脆性、突破其应变软化属性而发展起来的新型建筑材料。造价高、常用掺合料矿渣和粉煤灰等供不应求以及高温下ECC材料和构件力学性能劣化等因素制约了该材料广泛的推广与应用。因此,本文提出采用陶瓷抛光砖粉(以下简称陶粉)作为胶凝材料取代粉煤灰,采用陶瓷再生砂(以下简称陶砂)作为细骨料取代石英砂,并在使用PE纤维的基础上掺入适量玄武岩纤维,旨在改善ECC常
学位
<正>党的二十大擘画出实现中国式现代化的宏伟蓝图,在积极稳妥推进碳达峰、碳中和的目标下,要立足我国能源资源禀赋,坚持先立后破,有计划、分步骤实施碳达峰行动,提出了深入推进能源革命,加快规划建设新型能源体系,确保能源安全的新部署。这一新部署为新型电力系统建设过程中,确保传统能源的逐步退出建立在新能源安全可靠替代的基础上提供了基本遵循。
期刊
期刊
乡村振兴和现代化建设是新时代乡村发展的主旋律,是对乡村社会的一次整体性、系统性重构。这一历史性重构牵动着乡村社会、经济、政治、文化、产业、生态等各方面变革,其中人是变革的关键因素,人的全面自由发展既是乡村振兴的核心要素也是最终目标,而实现这一目标就需要立足乡村社会本身的特殊性来思考和回应。身份问题是对个体价值尊严及其作用发挥得以确证的重要因素,千百年来身份的定位功能、识别功能和赋权功能规范着乡村熟
学位
在“双碳”目标背景下,我国能源结构发生改变,使以煤电为主的电力行业面临不小挑战。煤电的碳排放占我国全行业碳排放的40%,因此煤电成为实现“双碳”目标的关键。基于我国“富煤少气贫油”,煤电仍将在长时间内是电力供应的基础负荷,因此积极地探索安全高效的火力发电技术,实现火电企业智能化、数值化、互动化转型显得尤为重要。锅炉爆管引起的非计划停机时间约占机组停机时间的40%,而随着火电机组进一步向低数量、大容
学位