基于CRF的原生数字图像文本提取研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:siyu321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页与电子邮件中的图像经常嵌入一些文字信息。以图像作为文字的载体源于许多需求,例如美化页面标题和文章标题,广告中吸引人们的注意,还有一些隐藏信息如垃圾邮件中的不良文本信息可以很容易地转为原生数字图像在网络中传播,从而避过文本过滤技术等。原生数字图像是用计算机软件生成的图像,图像中的文字包含许多有用的信息,能够客观反映图像所要表达的内容。因此,原生数字图像的文本提取对于网页内容的索引和检索、获取和过滤(如广告和垃圾邮件的过滤)等都存在着重要的意义。但是,原生数字图像文本提取工作面临分辨率低、文字本身大小和字体颜色的多样性以及边缘柔化所引起的连通体生成困难等问题,而真实场景图像的文本提取方法不一定适用于原生数字图像中的文本提取,所以原生数字图像中的文本提取成为了一个具有重要意义和挑战性的课题。   本文主要研究了基于条件随机场的原生数字图像中的文本提取。条件随机场不仅具有对上下文信息进行建模的能力,而且能够基于有监督学习自动确定模型中的参数。本文利用条件随机场根据连通体自身特征和连通体之间的上下文特征做出文本连通体与非文本连通体的分类,能够有效地从原生数字图像中提取文本信息。实验表明其有效性。
其他文献
Web从产生到现在已经发展了超过20年,它最初产生时的主要目的是方便全世界的科学家共享信息。但是随着网络的发展,如今web的功能已经发生了很大的改变,网站内容日益丰富,Web
入侵检测系统作为网络安全防护的重要手段之一,目前已得到越来越多的重视。将数据挖掘中的算法应用到入侵检测技术中是把入侵检测系统智能化的重要一步。由于入侵检测系统在
行人检测是目标检测的一个分支,它旨在将行人从连续的视频帧或单帧图像中准确的定位并分割出来,是计算机视觉领域最为活跃也最富挑战性的课题之一。本文对行人检测算法的研究,旨
在信息化程度高度发达的今天,随着高技术武器的不断发展和致伤武器的多样化及其在战争中的广泛应用,不但导致短时间内出现大量的伤病员,而且使得伤情变得复杂。这对长期处于和平
在云存储环境下,如何高效、动态地完成多副本数据的完整性审计是一项极具挑战性的问题。数据所有者为了节约存储成本,通过远程服务将数据外包存储在云服务端。由于云服务提供
现今的大多数数据挖掘算法更偏重于发现大部分数据的模式匹配,却不太深入研究那些偏离模式的特殊数据对象。然而恰恰就是这些罕见事件、特殊对象、异常信息的价值有时候往往会
近些年,计算机辅助语言学习发展迅速,并且受到了越来越多的学者广泛地关注。该学科主要通过计算机和信息技术的辅助来推进简单的外语教学活动。但事实上却很少有能够用于外语口
在信号处理领域中,主动噪音控制的任务就是在受到干扰和噪声污染的信号中提取有用信号。自适应滤波能够实时地调整自己的滤波参数,以满足某种最佳准则的要求。自适应滤波算法
近年来随着生物医学工程的迅猛发展,测量技术的提高使得大量的医学信息以电子格式被记录下来,这些信息不仅包括CT影像,X光片,各项生理指标还包括病人的年龄,性别,体重,身高,既往病史
在生物领域,对DNA与蛋白质相互作用的研究是对基因表达与调控进行了解的重要手段。随着ChIP-seq技术在这些领域的应用日益广泛,如何对大量Chip-seq数据进行处理分析并获取生物