【摘 要】
:
自然场景图像中嵌入的文本,是图像高层语义内容的有机组成部分。场景文本有诸多表现形式,如交通标志牌、字幕、商店名称、文本条幅、建筑物额匾等,这些信息可以为场景理解提
论文部分内容阅读
自然场景图像中嵌入的文本,是图像高层语义内容的有机组成部分。场景文本有诸多表现形式,如交通标志牌、字幕、商店名称、文本条幅、建筑物额匾等,这些信息可以为场景理解提供极有价值的帮助。对自然场景图像中文本内容的提取和识别,将有助于场景图像资料的检索、查询、理解、压缩,近而提高图像资料的管理效率。以OCR为代表的传统文档分析技术经过几十年的发展已经趋于成熟并取得了巨大的成果,能够准确高效地处理人工文本,但仍无法有效地处理自然场景中的文本字符。目前,对场景文本的研究刚刚起步,停留在算法设计阶段。本文结合科研课题,设计和实现了场景图像文本提取软件包,该软件包主要包括图像采集模块和文本提取模块。图像采集模块利用网络摄像头采集图像,该模块采用基于Directshow技术的开源视频处理库实现对摄像头的控制,并通过Qt设计实现了操作友好的图形界面。文本提取模块是场景图像文本提取软件包的核心,该模块对基于灰度统计和多尺度边缘检测的文本定位结果进行数据融合,可以有效地精确定位出场景图像中文本并保持较高的检测率,另外,文本提取模块成功地移植到嵌入式系统平台并运行良好。通过对定位结果分析,本文采用一种图像增强方法以提高检测率;另外,对字符填充、文本域整行提取做了一定的探索。软件包的实现基于C++编程语言和OpenCV图像处理库,该系统能够较为准确地定位场景图像中的文本,且对字体的大小、颜色、排列方向等具有良好的鲁棒性。Windows平台上,处理一张640×480图片的时间少于5秒,能够满足实时应用;在嵌入式平台上程序运行正确,但耗时较长,约为1分钟。
其他文献
随着高校之间办学合作、合并重组等的日益频繁,我国许多高校往往有不止一个校区,或者在多地具有分校,传统的单一校园网组网技术已不能满足数据安全传输的要求。VPN是一种利用公
将现代加密技术应用于关系型数据库(Relational DataBase,RDB)中,是防止RDB敏感数据泄露失密,保证RDB安全运行的重要技术手段。
论文在对目前国内外RDB加密实现机制和方式
视频会议系统是一种集计算机、通信和微电子技术于一体的多方远程异地通信方式。在视频会议系统的发展历程中,如何提高视频会议中语音与图像的传输质量已经成为视频会议系统
电爆丝喷涂是将电爆炸技术应用于材料表面喷涂的一种新兴的技术,与传统的喷涂技术相比具有独特的优势,如涂层的结合度高且厚度均匀、喷涂速度快等。目前现有的大部分喷涂装置还
中国信息化产业的高速发展对互联网技术创新提出了更高的要求,网络信息的暴涨给舆情挖掘带来了更多的挑战。话题检测与追踪是网络舆情挖掘的重要研究内容,话题检测能够把纷杂
进化计算是指进化规划、遗传算法、和进化策略三者的统称。进化算法已经广泛用于工程控制、函数优化、机器学习等NP难问题的求解上,通过模拟生物进化过程中的杂交变异来保留父
伴随着传感器技术、通信技术和计算机技术的进步,无线传感器网络获得了迅猛发展,应用领域不断拓展,被誉为未来十大新兴技术之首,将对人类的生活和社会生产造成巨大的影响。由于传
很多科学工程计算和数值处理问题可以转化为稀疏线性方程组的求解。对于大规模的稀疏线性方程组的求解,目前使用最广泛且最有效的方法是基于投影的Krylov子空间方法。光滑粒
本文研究了结合AdaBoost和Camshift的视频人脸检测与跟踪算法,针对AdaBoost和Camshift算法的缺点提出了相应的改进算法。首先,研究了基于隐马尔可夫的模型的AdaBoost人脸检测
随着当前无线通信业务的迅速发展,可利用的频带日趋紧张,频谱资源匾乏的问题日益严重。但是研究表明,数量众多的授权频谱在大部分时间处于空闲状态,这种频谱占有状况与利用的不平