基于MSER的文本检测方法研究

来源 :天津师范大学 | 被引量 : 15次 | 上传用户:lwjjet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像中不仅含有丰富的图像信息,同时含有大量的文本信息,这是对场景的重要补充,是对场景内容理解的关键线索。随着多媒体技术的发展,数字化视频和图像日益涌现,这给我们带来丰富信息的同时,使得大量图像数据激增。通过自然场景中的文本认知获取场景中的文本信息,有助于理解场景内容,从海量的图像数据中检索、查询、浏览场景图像资料,提高图像资料的管理效率,并且有效节约时间、减少成本,提高信息检索技术的自动化程度。传统的文档图像的文本检测和识别已经日趋成熟,但是自然场景中的文本信息检测和识别却存在较多困难。自然场景图像中文本的文字大小是任意的,排列和对齐方式是未知;光照因素往往对图像中的文本颜色,亮度,对比度等产生影响;拍摄角度的不同,很容易使文本信息产生几何变形,字符断裂等现象,另外由于自然环境的影响,也会降低所拍摄的照片的质量。因此自然场景中的文本检测和识别常常会遇到诸多困难。自然场景中的文本检测是检测图像中是否含有文本信息,并确定文本信息的位置。本文的主要工作如下:将最大极值稳定区域(Maximally Stable Extremal Regions)应用于文字检测。MSER是当使用不同的灰度阈值时,图像所具有的的最稳定的区域,具有仿射不变性。而自然场景中的文本信息与背景具有明显差异,并且具有区域稳定性。利用MSER极好的仿射不变性,将图像中稳定的区域进行提取,并从中筛选出文本区域信息,效果良好。但是存在颜色空间中各异的颜色,转换为灰度值后,却存在近似的现象,导致背景与文本区域的过度融合现象。本文提出将颜色聚类和MSER融合应用于文本检测。先通过MSER确定聚类中心和聚类种类,然后对原始图像进行颜色聚类从而筛选文本区域,从而克服复杂背景进行文本检测和MSER稳定区过度融合的问题。
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
安全阀作为一种防超压的安全泄放装置,在工艺站场中起着重要的作用,它主要用于受压设备、容器及管道的超压保护.当设备、容器或管道中的压力升高,达到安全阀的设定压力时,阀
第十五届北京国际艺术博览会即于2012年8月16日至8月20日在北京中国国际贸易中心举行,展场面积1万多平方米,展品包括中西绘画、雕塑艺术及多媒体等。本届艺博会举办了海峡两岸艺术交流展及“当代艺术价值与金融投资策略论坛”,务求促进海峡两岸的艺术文化交流与其进。来自台湾的名典画廊、东门美术馆、涵艺术中心、艺大利艺术中心等十余家画廊及内地的清华大学美术学院、北师大艺术学院、北京石齐美术馆、上海宝艺术、
飞思卡尔半导体推出第一款基于其QorIQ通信平台并且融入QuICC Engine多协议技术的处理器.QorIQ P1012/P1021产品系列为使用传统多协议接口的客户提供了向全IP环境迁移的高性
将结晶器和电磁搅拌器作为一个整体来配置结晶器电磁搅拌技术的基础上,对多个钢种进行在线工业试验。通过铸坯的低倍检验和分析,对其冶金效果进行综合评价;同时相应地对部分
从事中职会计教学十几年,本人觉得对学生会计基础课的理解和掌握是后期学生账务处理的重要前提,为此,基础课的学习显得尤为重要,好的学习方法会使学习事半功倍.
针对人工智能机器人引领科技的融合创新,本文分析了人工智能同机器人之间的关系,为了能够促进机器人领域的智能化,就需要将人工智能有效的融合当中,在机器人大脑当中植入“人
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
在机械制造业中,物流技术能否满足整个机械制造系统的需求,将直接影响到机械企业的生产过程,甚至是整个机械企业的整体效益.本文通过对物流系统的发展过程和重要性进行详细阐