视频帧及彩色图像中的文字识别技术的研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:ccssddnn_ccssddnn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从视频帧和彩色图像中进行文字侦测和识别是一个特殊的研究范畴,并且有着它自己的一套方法,对这个方向中涉及的一些具有挑战性的问题正在获得广泛的研究,并且也因为这项研究有着巨大的商业前景.但是到目前为止,还没有一个足够健壮的系统能够胜任从各种的视频帧中完成文字提取的任务.在该文中,作者给出一些作者在这方面的研究工作的描述及结果.从理论方法上,作者借鉴了连通组元等研究方法,并运用文字特征作为一个常规检测手段,通过实践的摸索,给出了作者自己的文本定位系统.文中给出了实验的一些统计数据,部分实现的源代码在附录中.
其他文献
该文主要论述了开发PDM系统中系统管理的主要方法,并基于J2EE平台,参考国外先进软件经验,采用UML设计,开发了启明星PDM系统中的系统管理部分.该文共分7章,第一章介绍了产品数
该文首先提出了提高组件可靠性要解决的具体问题,参考了Meyer[1]的"按契约设计"(Design By Contract)的思想来提高组件的实现及设计上的正确性.但这一思想只适用于Eiffel语言
在网络安全方面,人们以往大多针对诸如口令入侵、特洛伊木马术等研究较深,对嗅探器(Sniffer)的研究却是近一两年的时间里才引起了人们的重视.因此,该文将重点讨论关于嗅探器
在多媒体技术迅速发展的今天,多种媒体之间的信息融合越来越受到人们的重视.对可视语音(Visual Speech)的研究正是这样一种综合考虑了语音和发音时各可视部分器官动作的多媒
该课题是北京市自然科学基金资助项目"混沌同步及其在保密通信和信息加密中的应用研究"的一部分.课题要研究的内容是基于混沌理论,设计实现一个安全性高、代价低、易于软件实
该文主要做了基于自由度分析的参数化设计的研究工作,文中我们在对(1)变量几何法,(2)几何推理法,(3)图形操作法这三种方法分析的基础上,提出了一种混合陈述式约束和装配约束
该论文介绍了基于XML的安全文档及其处理工具提出的背景、意义、研究现状及在该软件设计和实现中使用的信息安全、密码学、XML及XML安全规范等相关概念、标准和技术;在此基础
网络资源管理中最重要的是网络资源信息的获取,对于以前小规模的网络,运营商采用手工的管理方式,但是面对当前这样正在日益增长的庞大的、动态的网络,采用手工管理是不可能的
该文以2001年北京市自然科学基金(4012005)、2001年北京市教委科技发展基金为科研任务,在分布式人工智能(DAI)、分布式数据库理论的基础上,以国家旅游局金旅工程为应用对象,
WEB服务是面向服务的开发模式和WEB技术共同发展的结果.采用现有的网络协议如HTTP、FTP或者SMTP作为传输载体,使用基于XML的XML-RPC或者SOAP作为远程调用和消息传输的数据标