基于手机设备的自然场景文本分析

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:luishifei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术、手机设备的发展和普及,基于手机设备的文本分析也有了较大的需求,如手机上的名片识别应用。而人们更加渴望的是从自然场景中提取出文本进行分析,如在手机上安装智能导游系统。其中关键点和难点就是准确快速的文本定位。原因在于自然场景的复杂多变性容易影响定位效果,且主流手机设备的硬件资源也限制了一些优秀定位算法(如基于区域、纹理、边缘的方法,或结合三类方法优点进行融合的方法)的移植。本文正是在没有成熟的算法和应用的背景下,根据国家自然基金课题——自然环境文字分析与处理关键技术研究的需要,进行一次探索性的研究与应用。本文主要针对基于手机设备的自然场景文本分析进行研究。主要解决两个问题:第一是如何获得手机摄像头捕获的图象数据;第二是如何在手机设备上进行文本信息的实时定位。针对这两个问题,本文首先重点研究了Windows Mobile手机上摄像头的开发。通过对一些手机设备操作系统的研究,选用DirectShow技术在Windows Mobile操作系统上对摄像头进行开发,获取其捕获的图象数据;其次,考虑到手机设备的硬件条件,重点选择简易边缘检测和笔画检测两种方法提取边缘,然后经过后续处理和改进的连通区域标记法提取出文本备选区域。本论文综合设计并实现了整个系统,并通过对300幅自然场景图象的实验,检测了算法定位效果,表明了系统的可行性与合理性。本文的设计思想和方法对文本定位技术研究和产品开发具有一定的参考价值。
其他文献
驾驶员疲劳驾驶是引发交通事故的一个重要原因,因此,如何有效的监测和防止疲劳驾驶,对于减少交通事故有着十分重要的实用意义。驾驶员在车辆行驶过程中是否疲劳可以从眼睛的
呼吸疾病的机理信息在呼吸系统分布分散往往反应在整个胸部区域,呼吸音听诊作为一种主要的呼吸音监测手段,得到了越来越广泛的应用,但由于临床常见呼吸音疾病多为混合病变,传
ITU-T和ISO/IEC联合制定的新一代视频编码标准—H.264/AVC标准,支持各种网络环境中甚低码率下的高质量视频通信,具有同类标准无法企及的编码优势。由于标准中采用了更先进的
随着科学技术的发展,人类对于海洋的研究越来越深入。为了更好地了解海洋环境的特性,人们需要对一些特定的海洋参数进行测量。海洋流速——作为海洋环境的一个重要参数——对
遗传算法(GA)作为一门新兴学科,从二十世纪八十代开始迅速发展。遗传算法存在自然并行性,而并行遗传算法作为GA的一个重要分支,也得到越来越多专家们的重视。本论文针对传统
无线中继技术,已被用于Ad hoc/sensor网络和无线mesh网络,同时将被IEEE802标准组织纳入802.11、802.15、802.16、802.22等标准,也是B3G/4G系统的重要研究内容之一,而OFDM(orthogon
近十几年来,无线通信技术得到了广泛应用,极大地推动了社会的发展。射频识别(RFID)技术,是一种利用无线通信实现的非接触式自动识别技术,被认为是21世纪最有前途的IT技术之一。在
基于位置的移动社交网络服务(LBSNS)应用极大丰富了用户社交内容,提升了用户体验,但也存在着较高的用户位置隐私泄露的风险,如何保护用户的位置隐私安全是LBSNS应用在推广过
随着计算机的问世,人机交互的概念应运而生。人与计算机完成人机交互的中介最初以键盘、鼠标为主,这对于身体健全的人士,通过简单的手动操作即可完成。为了使人机交互更加具
分析了涉密单位涉密U盘集中监管的需求,提出了一种可以实现U盘唯一性标识和状态信息采集与监管的网络化保密管理技术方案;基于客户端/服务器结构,研制了一种涉密U盘远程监管系统