网络图片中文本区域的定位技术研究

来源 :四川师范大学 | 被引量 : 2次 | 上传用户:isaxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术与互联网技术迅速结合形成了独特网络文化,流传于网络的大量数字信息给人们的日常生活和工作带来巨大影响。一方面,诸如图书封面、信封封面、文档内容的文字部分等有益图片需要计算机自动完成相关文字内容的搜索工作,从而达到释放劳动力、数字化办工的需求。另一方面,流传于网络的不良图片种类繁多,需及时检测和过滤,消除在网络传播中的不良影响。文本是图像信息中最重要的内容,基于图像的文本信息检索也应运而生。现有的字符识别技术已经非常成熟,只要能准确定位出文本,即可分割和识别出文本。因此,在网络图片中定位出文本就显得非常重要。本文的主要工作围绕如何从网络图片中定位和提取文本区域信息的各个方面和步骤展开,研究的工作主要集中于网络图片中文字区域的检测、定位和文本区域的辨别以及相关的算法研究。网络图片并无统一的规范和标准,因此包含的文本也形式各异,字体的不同大小、排列方式、语言种类、色彩、亮度、背景的复杂程度以及网络图片本身的分辨率、质量等都将影响到算法的准确性和适用性。这些因素都给网络图片中文本区域的定位技术研究带来了困难和挑战。在文本检测方面,本文对比了基于连通区域、基于边缘检测、基于纹理学习和基于机器学习等算法,最后选择角点为文本的主要特征,并提出了基于角点的高斯金字塔自动文本检测和定位算法。该算法能自动地检测到同一网络图片中大、中、小三种不同大小的文本。为达到高召回率,改进了积分投影算法,提出了分段处理的思想在完成同一图片中不同位置多文本区域的定位。为提高查找精度,采用了基于文本混合特性的启发式规则。在性能评估方面,主要采用召回率、精度和运行时间为评估标准。本文提出的算法是在一系列文献阅读和实验对比下设计和完成的,实验结果表明,针对传输于网络上的书籍封面和CD唱片封面的图片,本文算法能较好地完成迅速、准确定位。可配合文本分割、文字识别系统完成网络图片中文字的提取和识别,辨别图片的语义内容,提取有用信息,过滤不良信息。
其他文献
移动无线传感器网络具有广泛的应用。例如,把传感器节点固定在汽车上,来监测城市的路面情况,汽车携带的节点构成了移动传感器网络。节点通过汽车的震动情况获得路面平坦信息,
随着科技的发展和自动化教育水平的不断提高,涉及编写代码的地方越来越多。其中,作为培养软件开发人员摇篮的各个高校也纷纷开设了一系列编写代码的课程。由于电子文档易于复
人脸识别技术通过计算机技术对人脸图像或者含有人脸图像的视频序列进行分析,并提取人脸图像的特征进行身份鉴别。人脸识别技术是模式识别领域的研究热点之一,在身份认证、表
随着Internet的迅速发展,全球对终身教育的需求以及现代远程教育的深入开展,以异步教育方式为主要特征的E-Learning正成为Internet上的一种重要应用,同时E-Learning系统也越
P2P网络已成为近年来业界研究和关注的一个焦点,但是P2P网络具有开放性和匿名性,为提供虚假文件、恶意攻击等一些恶意行为提供了可乘之机,P2P网络中的信任和安全问题就出现了
随着现代社会经济和科学技术的快速发展,人们活动领域不断扩大,身份识别技术在当今社会生活和经济活动方面显得越来越重要。传统的密码、智能卡或动态口令等具有先天性安全缺
随着信息化的不断深入,企业对依托信息网络,实现业务网络审批的需求日益增强。电力企业大多繁琐复杂的日常业务均属流程类活动,办理时常须在不同的职能管理部门间进行审批活
随着以Internet软件为核心的信息系统的深入,基于Internet的分布式计算机系统及开放式网络环境增加了系统的复杂度、故障率和不安全因素,使得软件系统变得日趋庞大和难以驾驭
随着我国的经济发展,城市规划建设工作也就显得尤为重要,给水管网也随之成为城市居民的生活命脉,为了实现有效的对供水管网的管理,本文探索了基于.NET与ArcGIS Server结合技
近年来,无线传感器网络引起了世界各国军事部门、工业界和学术界的极大关注。数据聚集是传感器网络中一个比较耗时的操作,特别是在高密度网络中。例如,在一个森林火灾监控系