藏文现代印刷物版面检测技术研究

来源 :西藏大学 | 被引量 : 0次 | 上传用户：wjlayt

【摘要】

：

藏文现代印刷物是藏文化资源的重要组成部分,藏文现代印刷物的版面中文本行包含了许多重要的信息,有效的检测出藏文版面中的文本行区域是实现藏文化资源数字化保护的重要一步

【作者】

：

吴燕如

【出处】

：

西藏大学

【发表日期】

：

2004年期

【关键词】

：

卷积神经网络藏文现代图书版面藏文自然场景版面 Faster R-CNN SSD

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

藏文现代印刷物是藏文化资源的重要组成部分,藏文现代印刷物的版面中文本行包含了许多重要的信息,有效的检测出藏文版面中的文本行区域是实现藏文化资源数字化保护的重要一步。本文采集到的藏文现代印刷物版面分为藏文现代图书和自然场景藏文版面,鉴于传统的检测技术还不能有效解决藏文现代版面分辨率低下,字体样式多变的问题,如何有效的实现藏文现代印刷物版面的检测,本文采用两种深度神经网络的目标检测方法,分别实现对藏文现代印刷物版面中的文本行区域的检测。主要贡献如下:第一部分,为了解决藏文现代印刷物版面中各个水平和近似水平的文本行区域的检测,采用了基于Faster R-CNN的藏文现代印刷物的版面目标检测算法,先详细介绍了Faster R-CNN检测网络结构和算法原理,其主要思想是当区域建议网络提取到感兴趣目标区域,再进入Fast R-CNN网络得到藏文版面整体的特征图,最后Faster R-CNN判断出感兴趣区域属于哪个类别,在Res Net-50网络结构中进行数据集训练,实现文本区域的分类和定位。本文通过设置anchor为四种尺度,五种比例的情况,满足特征图上每个像素点可以生成20个尺度大小不同的anchor框,区域建议网络共生成1000个感兴趣的目标区域。实验表明,改进后的Faster R-CNN检测算法相比原始的Faster RCNN在藏文现代印刷物数据集上有更好的检测效果。在不同规模的藏文现代印刷物数据集上分别进行实验,都具有一定的检测效果。由于自然场景中的藏文版面本身的复杂性,自然场景中的藏文版面数据集上的检测效率比藏文现代图书数据集上的检测效率低,但整体上检测效果比较理想。第二部分,本文还采用了基于SSD藏文现代印刷物版面检测算法,实现大小比例不同的文本行的检测。首先将Res Net-50网络中的全连接层换为卷积层,在此基础上增加了辅助卷积层,通过利用第3到7层卷积层中的特征图,共提取得到五个尺度的特征图。其次对提取到的特征图上每个像素点分别设置生成五种尺度和五种比例大小不同的先验框,最终每个像素点共可以生成25种大小比例都不同的先验框,与真实框进行匹配,得到每个先验框对应的类别置信度和坐标位置,最后判断其对应的预测框是否为文本行目标,并对其位置进行回归,使其最大可能的接近真实框。经实验发现,该算法对藏文现代图书版面和自然场景藏文版面都达到了良好的检测效果。

其他文献

无线传感网络中基于锚节点动态路径规划的节点定位算法研究

无线传感网络由分布在空间中的大量廉价传感器节点组成,由于其具有自组织、低成本和易于部署等优点,广泛应用于环境监测、智能家居、军事和工业等领域中。在这些应用中,节点

学位

无线传感器网络节点定位移动锚节点动态路径规划

超椭圆曲线密码体制中除子标量乘的并行算法研究

作为椭圆曲线密码体制(ECC)的推广,超椭圆曲线密码体制(HECC)的代数结构更加复杂,安全性更高,应用前景更加广阔。然而,HECC仍存在一些瓶颈问题亟待解决,其中尤为突出的问题是

学位

超椭圆曲线密码体制并行计算Spark集群平台除子标量乘划分整合模型滑动窗口优化算法

基于R-CNN的车辆检测算法研究

车辆检测在辅助驾驶、交通管理、遥感图像等方面都有着重要应用,随着近些年车辆的不断增多,和人们对于车辆检测技术需求的不断提高,车辆检测已经成为目标检测领域的重要研究

学位

车辆检测深度学习Faster R-CNNMobileNet维度聚类特征融合稀疏表示

基于MEA的神经生物传感系统研究及其在脑切片的应用

神经元信息传递机制的研究,是脑科学领域内的重要研究课题之一,是人类对大脑的认知过程的重要环节,并且对于治疗脑神经疾病也具有极其重要的意义。近年来,关于神经信号传递机制的相关研究引起了相关领域研究学者的广泛关注。神经信号的传递机制研究尤以研究神经元的电信号为主,因此神经电信号的采集成为了重点研究问题之一,针对这一问题,本文提出并研发一套基于微电极阵列(Microelectrode Array,MEA

学位

神经电信号采集微电极阵列脑切片生物传感器

视觉反馈非固定位姿目标机器人拾取控制研究

目前在工业生产线上,工业机器人对固定位置目标物体的抓取及搬运控制较为成熟,但是实际工业生产线上的目标物体的位置和姿态并不总是固定或规则的,当前对于这种位置和姿态不

学位

视觉反馈非固定位姿目标识别目标定位空间约束路径规划

基于视觉图像与激光点云融合的交通车辆检测

近年来,随着人工智能技术的发展与成熟,其应用越来越广泛,自动驾驶则近几年国内外研究团队对人工智能技术的一个重点研究方向。车辆检测是自动驾驶需要完成的首要任务,使用多

学位

激光点云数据融合特征提取车辆检测

基于卷积神经网络的多进制相位调制信号识别

多进制相位调制是无线通信中的一种主要调制方式,具有抗干扰性强、频谱利用率高、电路实现简单等优点,被广泛应用于卫星通信、民用移动通信中。其子类信号二进制相移键控信号、四进制相移键控信号和八进制相移键控信号的识别一直是调制识别领域中的热点问题。传统调制识别算法方法需要强大的专业知识和工程技巧来设计特征提取器,难以实现信号特征的自动提取。因此,本文将卷积神经网络应用到调制信号识别领域中,对多进制相位调制

学位

卷积神经网络调制信号识别时频图星座图深度学习

机器人技术综合实训集成系统的设计和应用

工业机器人技术的发展日新月异,随着市场对机器人需求的加大,同时也让我国发展为世界最大的工业机器人应用市场,并为中国制造业的转型发展提供了巨大推动力,极大提升了该行业

学位

工业机器人实训集成系统机器视觉Affine-Linemod

基于PPP模式下的浙江省政务云建设研究

“云计算”的概念由谷歌最早于2006年提出后,该技术当前在全球蓬勃发展,由最初简单的“数据共享”到如今的“应用共享”,改变了人们的生活。云计算技术同样应用在了政府的政

学位

云计算PPP模式政务云建设浙江

基于数据驱动的涡扇发动机剩余寿命预测

涡扇发动机是一种高度精密的热力机械。这种机械系统结构复杂,经常在极端环境下工作,极易发生故障造成不可挽回的损失。为了保障系统安全可靠运行,降低事故发生概率,预测它的

学位

涡扇发动机剩余寿命预测机器学习梯度下降树梯度单边采样

藏文现代印刷物版面检测技术研究

与本文相关的学术论文