自然场景下基于兴趣点聚类的文本提取方法研究

被引量 : 0次 | 上传用户:beginI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景中的文字包含了丰富的语义信息,提取和识别这些文字对于完整地理解和认知自然场景图像具有重要的意义。但是,由于自然场景的复杂性和不确定性,要实现这一目标还存在许多困难。现有的方法大多针对性较强,缺乏对各种复杂情形的适应能力。针对这一问题,在深入研究现有的自然场景下的文本提取方法的基础上,提出一种基于兴趣点颜色聚类与空间排列分析的自然场景文本提取方法。该方法将文本提取分为两个主要阶段:文本候选区域粗略定位阶段和文本精确提取阶段。文本候选区域粗略定位的目的是排除明显的非文本区域,以缩小后续处理的范围,为了改善传统的基于边缘密度的方法在判定文本候选区域时阈值过于敏感、适应性差的问题,新方法采用了一种基于颜色散布强度分析的方案,以局部颜色变化强度作为文本区域的判定依据,并结合全局阈值与局部自适应阈值,压制背景,突出文本,使阈值选择更加宽松,算法适应性更强。在文本精确提取阶段,新方法根据自然场景中文本颜色与背景差异明显和文本空间排列规则这两个重要特性,首先采用基于兴趣点颜色聚类和统计分析的方法,捕获文本颜色,与一般的颜色聚类方法相比,新方法避开了大面积背景颜色对聚类统计结果的影响,提高了文本颜色捕获的准确性;然后,算法根据捕获的颜色对源图像进行子图分离,使文本成分与复杂的背景分开,以保证后续文本判别算法的抗干扰能力;为了克服文本的字体、尺寸、形状变化对一般的基于文字本身特征的方法的影响,算法给出了一套有效的文本空间排列特征表示方法,并利用该特征作为文本判定和提取的主要依据,取得了较理想的效果。实验表明,基于兴趣点颜色聚类与空间排列分析的自然场景文本提取方法对昏暗环境、复杂背景、文字的尺寸、颜色和形状变化等都有较强的适应能力。
其他文献
铭记伟大历史给我们的启迪,把握历史所揭示的规律性,加大宣传中国人民抗日战争的巨大贡献,扫除美日为阻碍中国和平发展的种种障碍,坚定不移地走和平发展的中国特色社会主义的
一直以来,我国双向转诊普遍存在的问题是上转容易而下转难,要让更多的患者有社区首诊也很难。要解决这一难题不能只是依赖行政干预,而是要更多地依靠体制和机制创新,"112"双
专业化与多元化代表了两种不同的经营模式,在已有文献中常被看做是一对互有冲突的"悖论"。本文从这对构念在企业与集团两个层次上的不同内涵及层次关联的分析入手,对企业间组
目的探讨膝关节损伤关节镜术后的早期康复护理效果。方法笔者所在医院骨科治疗的膝关节损伤病患者60例,均于硬膜外麻醉下进行关节镜手术治疗,随机分为康复组和对照组各30例。
第一次听说"云打印"是2009年5月,看到一则新闻——黑莓(Black Berry)手机可使用惠普的云打印服务,服务范围限于美国本土。今年4月中旬,Google发布了云打印草案,鼓励云打印服
本文利用2000—2009年我国对日本、美国和欧盟农产品出口的面板数据,通过建立引力模型,分析当前颇为盛行的技术性贸易壁垒对我国农产品出口贸易的影响。结果表明,日本、美国
目的探讨培养实习护生优质护理服务意识和提高护理工作能力的方法及效果。方法对护生进行优质护理服务规范化培训后实行患者责任包干制模式。结果提高了护生的规范化护理服务
自起动永磁同步电动机兼有异步电机能够自起动和永磁同步电机高功率因数及高效、节能的优点,得到了越来越多的关注和应用。但是,由于永磁电机磁路结构的复杂性,使气隙磁场中
"五缘文化"理论是探讨影响海外华人社会和经济发展及其与祖国联系的文化深层因素的理论,其诞生二十年来,为指导学术研究和侨务工作做出了重大贡献。随着时代的发展和族群的代