网络文档图像快速分类的研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:q569293407
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、智能手机和通信技术的迅速发展,互联网上的文本、图像、视频、音频等多媒体数据快速增长。这些日益增长的数据既为人们生活提供了便利,同时又对信息有效利用提出了挑战。考虑到近年来网络数据中视觉数据所占比重越来越大,网络文档图像数量也快速增长,大量的文本信息隐含在图像中。文档图像内容的识别与理解对于网络信息有效利用具有重要意义。本文研究网络文档图像快速分类技术,主要任务是对互联网上的图像按照图像类型与图像中是否包含文字进行分类,即将网络文档图像分类为自然场景图像(包括有文本/无文本场景图像)、合成图像和纸张文档图像(包括扫描/拍照纸张图像)等几种类型。按照分类的难易程度,首先完成对网络图像的粗分类,将图像分为场景、合成、拍照文档与扫描文档四类,然后按照图像中是否包含文本对自然场景图像进行二次分类。在图像类型分类(粗分类)阶段,通过提取表示图像质量的多种全局和局部特征,建立层次化的分类框架,完成基于类型的快速分类任务;在检查图像中是否包含文字的分类(细分类)阶段,主要针对自然场景图像,通过提取候选文字“角点”的方法,快速定位候选文本区域,然后基于颜色,边缘与梯度等信息提取区域特征,并训练字符分类器对候选区域进行分类从而确定图像是否包含文字。实验表明,本文设计的层次化分类系统,能够快速准确地完成对网络图像的分类任务。本文的研究成果主要包括两点,一是针对网络文本图像的特点设计出一系列快速有效的特征提取算法,并构建一个合理的图像分类系统,实现对网络图像的快速分类;二是建设并发布一个包含四种不同类型的多语言文档图像数据库,内部包含超过40,000张网络图像,供学术界免费使用,进一步推动本领域的研究。
其他文献
政府引导基金作为一种政府出资,促进经济结构调整、创新财政资金对产业发展的支持方式,逐渐被各级政府所推广采用.但是,由于政府引导基金运作具有较强的探索性,管理决策流程
随着科学技术的发展与进步,多个体系统的研究也得到了迅速的发展,而一致性问题又是多个体系统研究中的一个十分重要的课题。本文通过一种新的方法——边拉普拉斯方法研究了一
近年来超声检测技术凭借其穿透能力大、设备轻便、操作安全被广泛的应用于各个领域。超声检测技术中最常用的方法是脉冲回波法,主要原理是通过金属内部反射回来的脉冲波来判
法国于2019年颁布了数字服务税(简称DST),英国、西班牙、意大利和其他国家也正在制定类似的法律.DST可以看作是一种针对地域性特殊平台租的税,可以说它解决了国际税收中真正
Net Micro Framework是微软基于.Net平台设计的新型嵌入式操作系统,以下简称MF,它主要是针对硬件资源有限的设备进行设计的,目标是使得C#托管程序运行在资源受限的设备上面。它的
随着Agent技术在工业、交通、国防、军事、商务等领域日益广泛的应用和深入的发展,基于单Agent和多Agent的决策问题日益复杂多样,一系列复杂的大规模动态决策问题日益突出,因此,
张喆翔简历: 竞立媒体(中国)董事总经理。服务WPP集团11年,先后在奥美广告、传立媒体、迈势媒体从事媒介策划和管理工作,毕业于北京大学法学专业。    前瞻观点: 2008年,面对日益复杂的媒体环境以及奥运所代表的大事件,从单一媒介策划层面来讲,媒介公司如何通过媒介创新和整合运用,发展更多的品牌化内容,让品牌能够更好地在竞争中和消费者的脑海中脱颖而出,挑战相较往年更大。媒介公司也需要有足够的准备
建设社会主义新农村,是落实科学发展观的客观要求和必然选择,也是一项需要全社会参与的系统工程。作为地方的主流媒体,地市级电视台在加强新农村宣传报道力度、发挥更大影响
期刊
胡锦涛总书记在中纪委第七次全会上的重要讲话,从四个方面深刻论述了加强领导干部作风建设的重要性,强调指出,各级领导干部要大力倡导“勤奋好学、学以致用,心系群众、服务人