基于MSER与颜色聚类的自然场景文本检测研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:pjpdl6123475
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景下的文本检测是自然场景图像信息提取的基础,在车牌识别、实时翻译、图像检索等领域具有广泛的应用价值及研究意义。基于连通区域的方法是自然场景文本检测中最为常见的方法,其中最大稳定极值区域(Maximally Stable Extremal Regions,MSER)算法和颜色聚类算法都有着广泛的应用。针对传统MSER算法及传统颜色聚类算法的局限性,本文提出基于图像增强MSER与改进颜色聚类的自然场景文本检测算法,主要内容如下:(1)图像预处理。自然场景图像来源于真实的生活场景,图像的质量参差不齐,图中存在着大量的噪声,对原始图像进行双边滤波,并对彩色图像进行尺度缩放及灰度化处理。为了提升MSER算法在提取初始文本区域时的效果,提出基于暗通道先验理论与光照平均化的图像对比度增强方法。(2)候选区域提取。采用MSER算法提取初始文本区域,考虑到具有相似颜色的背景像素对颜色聚类存在较大的干扰,使用笔画宽度变换(Stroke Width Transform,SWT)与角度特征在初始文本区域中筛选出稳定文本像素;为了解决K-means聚类算法需要人工设置初始K值的问题,提出一种两级分组策略对稳定文本像素进行像素分组、确定初始颜色中心,并通过多尺度的颜色聚类获取候选字符区域。相比于传统的颜色聚类算法,所提算法取得的文本覆盖率更高。(3)非文本滤除。在提取出的候选区域中含有大量的非文本区域,通过提取候选区域的几何、笔画、角点及纹理特征并结合支持向量机进行字符区域验证,并针对Harris角点检测会产生误检点的问题,提出改进方案。另外,为提升字符检测的召回率,减少文本被错误分类的现象,提出一种基于文本位置关系的误分类召回策略。(4)文本行聚合与验证。由于多尺度的颜色聚类会导致颜色变化稳定的区域重复出现,针对这一问题,采用候选区域的外接矩形位置及颜色变化率进行区域滤重。另外,相对于单个字符,具有语义信息的词语更能体现图像所表达的意义,通过同一文本行中字符的相似性对候选字符区域进行文本行聚合,并使用垂直轮廓统计的方式将文本行分割成词,从而实现文本检测的目标。本文算法在ICDAR2013公共数据集上进行了性能评估,实验结果表明所提算法对自然场景图像中不同条件的文本均能获得较好的检测结果。算法的召回率与准确率分别为73.2%与82.3%,与其他文本检测算法相比,所提算法获得了较好的检测性能。
其他文献
目的:运用磁共振扩散峰度成像对脑泡型包虫病病例病灶实质区、边缘带(灶周0-10mm)、水肿区及正常对照区进行定量分析,明确病灶及受累周围脑组织范围。方法:收集2018年12月至2019年1月符合纳入标准的脑泡型包虫病病例16例,共30个目的病灶,进行MRI常规平扫、增强扫描及磁共振扩散峰度成像扫描;通过GE adw4.4后处理工作站测量病灶实质区、边缘带、水肿区及正常对照区磁共振扩散峰度成像定量指
人脸识别是多年来经过研究学者的不断探索和创新,快速发展起来的生物识别技术,因为采集人脸样本的过程具有不接触性,友好不侵犯性的特点,能以最自然、最直接的方式获取,人脸
数据伴随着人们的生产生活不断涌现,数据量在不断升级,产生的领域也越来越广,且维度也越来越高,这对分析这些数据的有效方法提出了前所未有的挑战,由此产生了“维数诅咒”的概念,特征选择是解决维数问题的有效方法,特征选择开始展现出越来越重要的作用是在上世纪90年代后,各种特征选择方法开始涌现,许多新的方法、新的思路层出不穷,对数据降维技术的发展起到了关键的作用。由Fisher判别演化的Fisher Sco
荣誉制度是弗吉尼亚大学规范学生学术行为、促进大学内部人员相互信任的一种契约,是学生对学校承诺自身的信用制度,反映了学生自治、自主管理的传统,涉及到校园生活的方方面面,其核心思想是:别人对你完全信任,你对自己的行为完全负责。荣誉制度是弗吉尼亚大学最为重要的一项制度,也被视为弗吉尼亚大学建校的根基,已成为美国高校的特色制度之一。研究弗吉尼亚大学荣誉制度,揭示其特色,可以为高校更好地承担起立德树人的使命
记忆的所有权效应是探索年幼儿童自我的一种有效方法。自我参照效应(self-reference effect,SRE)也是探索自我非常重要的方法和手段。大多数发展性SRE研究中应用的标准范式要求儿童能够识别与自我或他人相关的抽象性格特征。鉴于这种发展模式,我们应该利用具体而非抽象的加工任务,提供一种更合适的方法来探索儿童的自我发展。与自我参照效应相关联的另一个重要概念是自我所有权效应。所有权范式要求
随着移动芯片以及诸多功耗限制型集成电路应用的快速发展,如何减少芯片的功耗成为超大规模集成电路(Very Large Scale Integration Circuit,VLSI)设计的重要挑战。其中,静态随机存储器(Static Random Access Memory,SRAM)因其运算性能方面的优越性而被广泛应用于各种处理器的缓存和片上系统(System On Chip,SOC)中的嵌入式存储
当今移动机器人产业迅猛发展,已经深入到社会各个角落,而如何解决移动机器人自主控制是这一领域的热门问题,很多学者认为同步定位与地图构建(SLAM,Simultaneous Localization
近年来,科技发展日新月异,城市化进程不断加快,人们对定位的需求也越来越大,尤其体现在商业推送,物流管理,搜索营救等方面。在室外可以通过全球导航定位系统(Global Navigati
离线签名一直作为传统身份认证方式被广泛使用。对于签名的真伪性鉴别,目前主要还是采取人工鉴定的办法,效率低下。利用计算机实现离线签名的真伪鉴别具有广泛的应用需求和理论研究意义。LBP特征能够反映签名笔迹的纹理特征,但缺乏对签名轮廓的几何特性的描述。本文提出基于轮廓处局部二值模式(LBPC)特征和局部轮廓模式共生(LCPC)特征的离线签名鉴别方法,完成的主要工作内容如下:(1)为提升签名图像LBP特征
铝暴露途径十分广泛,暴露剂量不可预知,因此铝元素对人体暴露及随之产生的毒性作用难以避免。利用螯合剂和天然抗氧化剂拮抗铝的毒性已成为一种现代的方法。本研究从动物和细胞水平探究绿原酸(Chlorogenic acid,CGA,5-O-咖啡酰奎宁酸)对铝毒性的保护作用及机制。首先在动物水平上探究绿原酸对急性铝暴露小鼠肝脏和血液毒性的预防和保护作用。将8周龄雄性昆明小鼠在急性铝暴露(单次腹腔注射25 mg