综合文字和非文字区域特征的文档图像检索

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:missao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种改进的自适应文字区域提取算法,将文档图像分割成文字区域和非文字区域。对文字区域提取连通字符间空白、连通字符高度和宽度等局部特征,以及书写样式、段落特征等全局特征;对非文字区域,提取关键块特征。然后利用检索算法将文字区域特征和非文字区域特征结合起来,提高检索的准确性。同时,在检索算法中引入多维数据检索结构,有效地提高检索速度。通过对大规模文档数据库(包含12024个文档)的检索,表明该算法具有较高的效率,优于现有的一般文档图像检索算法。
其他文献
汽轮机内蒸汽湿度的大小和分布状况直接影响汽轮机运行的经济性和安全性。以汽轮机内蒸汽湿度的准确测量为目的,设计了基于微波谐振腔微扰法的蒸汽湿度测量系统:自动频率跟踪
本文主要从家具企业及工业园规划设计中总图设计存在的几个问题出发,探讨总图设计的有关要点。文中重点阐述了总图设计过程需要循序渐进,从前期调研分析到总图的概念设计,再
2016年,是我国“十三五”开局之年、我国全面建成小康社会决胜阶段的开局之年、推进结构性改革的攻坚之年。对于冶金装备制造业而言,在2016年乃至整个“十三五”期间,面对钢铁行
报纸
城市生态系统可持续发展评价是一个复杂的多目标评价问题。本文应用城市生态系统的结构、功能和协调度三个准则建立了评价指标体系,采用AHP法和变异系数法相结合确定评价指标
<正>牛奶装在方盒子里,而可乐却装在圆盒子里,这样简单的现象容易被人们忽略,其实却包含着经济学道理!就像很多人不会问"为什么苹果会从树上掉下来"一样,类似包含"大意义"的
2020年是全面建成小康社会和“十三五”规划收官之年,是实现现行标准下农村贫困人口全部脱贫目标任务的决战决胜之年。习近平总书记在十九届中央纪委四次全会上强调,要一以贯之
报纸
斗转星移,又迎来新的一年。2017年,我国冶金装备制造业面临新的挑战和机遇,如何应对挑战,把握机遇,是业界关注的一大热点。$$面临三大挑战$$挑战之一,钢铁业去产能,严控新增产能,冶金
报纸
对隔离开关的基本原理及二次回路进行分析,主要介绍了隔离开关的基本结构、用途与分类及闭锁原理、隔离开关的辅助接点在电压切换回路的应用。
在讨论求解二阶常系数线性微分方程的比较系数法、常数变易法的基础上,导出了降阶法.对比分析它们在解决一些实际问题的基本思想和方法策略,阐述了所述内容在教学中对学生进
应用于电力系统的Rogowski线圈一般工作在微分状态,采用外积分电路后,可对暂态电流作出较好的反映,便于分析故障信息。比较了Rogowski线圈在有源和无源外积分电路条件下直流