基于U-Net的历史文档图像分割研究

来源 :现代计算机 | 被引量 : 0次 | 上传用户:coni
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档图像分割是历史文档分析的关键技术支撑。针对历史文档布局复杂、页面黄化等造成其分割难的特点,提出基于U-Net的端到端的像素级别历史文档图像分割模型。该模型以嵌入空洞卷积的DenseNet为骨干网融合更丰富语义特征来解决历史文档图像布局复杂问题,使用Focal Loss函数解决数据集中类别极不均衡问题。在数据集DIVAHisDB的实验表明,该方法相对之前历史文档图像分割方法有更好的效果。
其他文献
在软件测试中,测试用例对被测软件的覆盖率,是发现软件缺陷的重要前提之一。采用软件工程实验方法,使用基本的数据结构代码片段对EvoSuite、Randoop和JavaPathfinder工具在相
宝玉虽"情不情",他与不同女子的关系也有亲有疏,与袭晴二人的关系也有亲疏之别:宝玉对袭人所有的是亲人之情,对晴雯所有的是知己之爱。这种亲疏有别的关系体现了宝玉的女儿观
素数的判定一直是数论研究的热点之一,尤其是大数的素数判断也是密码学的基础。对素数判定算法进行综述,详细介绍朴素判别法、埃拉托斯特尼筛选法、高效判别法、费马小定理、
近年来,成品油价格上涨不但使其日益成为影响我国物流业成本的主要因素之一,且因其不确定性,让很多业内人士亦难窥其方向和规律。所以这里探讨一下油价问题,藉此希望不但了解
结合卷积稀疏编码和分数阶变分的方法,提出一种新颖的卡通和纹理分解算法。首先学习一组通用的滤波器,它们可以有效地表示卡通部分和纹理图像,然后在基于稀疏的优化框架下将图像分解为卡通和纹理组件。为了进一步提高模型的性能,卡通信息采用全变分模型进行处理,纹理信息采用分数阶变分模型对其进行优化。实验结果表明,该方法在结构和纹理保存方面具有较好的图像分解效果。
在信息科技高速发展的时代,档案管理工作逐渐向着现代信息化的方向发展。在现代档案管理中,计算机的广泛应用推动了档案管理的改革进程,拥有强大计算能力的计算机可以储存巨大的
以屈原和陶渊明两位失意士人"士不遇"之后不同选择为切入点,发现二人选择不同的原因在于所受思想影响的差异:屈原主要单一接受儒家思想的影响,而陶渊明则受到儒道两家思想的
移动互联网带来信息获取的简便和途径的多样,对高职教育带来教学困境.对国内外相关研究现状的分析表明,课程教学模式具有从传统向结合移动化模式的改革需求和发展趋势,混合式
作为儿童作家,黄蓓佳被儿童文学界戏称为"获奖专业户",许多读者读了她的"倾情系列"之后都流了眼泪,因为她抓住了儿童文学让人心底纯净的魅力,同时明确了儿童文学的定义:优秀
文章主要运用传播学知识,结合内容分析法、综合研究法等对微博意见领袖的社会功能进行分析,对其造成的负面影响进行阐释,并提出了相应的意见和建议。