视频中维吾尔文本的提取研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ZHUTINGFNEG12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今随着多媒体技术的发展,视频已成为人们获取信息的渠道。面对海量的视频数据库,如何快速有效地进行视频检索已成为研究热点。视频中的文字信息为视频检索提供了可能。  维吾尔文字是基于阿拉伯字母的文字。由于维吾尔文和阿拉伯文本自身的特点,大多数已发表过的算法不能直接应用到视频中的维吾尔文和阿拉伯文。尽管在全球范围内的广泛应用,到目前为止,有关阿拉伯文和维吾尔文的视频文字定位和提取的研究非常少。本文在研究和总结目前的有关视频文字定位的算法基础上,结合维吾尔文特有的特点,提出了一种定位和提取视频中维吾尔文字的方法。  通常文本提取包含文本探测定位和文本分割。本文首先提出了一种基于笔画滤波的字幕文本定位方法,并给出详细的原理解释与实现过程。本文方案构成如下:首先对视频帧进行笔画滤波且对笔画滤波响应图进行非线性变换,然后利用维吾尔文在基线上横笔画居多的特征,通过水平投影找到基线位置,对基线上下方向进行扩展,确定上,下文本线。然后对通过垂直投影确定最的文本框,最后对用启发式规则对文本框进行验证。然后使用连通区域分析来修正文本的外接框,最后使用支持向量机(Support Vector Machine,SVM)对候选文本块进行筛选,排除在前一步骤中被误检为文本的非文本块。  对于定位后文本块的分割,考虑到维吾尔文的特性,本文在已有方法的基础上建立了文本颜色信息和纹理信息的联合概率模型。本文利用同一个文本块中其笔画宽度比较一致的特点来提取建模样本。从而使得训练的模型比较精确,因此本文建立的模型可以很好的将文字和背景分割开来。
其他文献
节点的移动性是移动Ad-hoc网络的重要特征之一。由于节点的移动会对节点间链路和路径的连通性造成破坏,进而降低路由性能,本论文针对移动Ad-hoc网络中存在的这个问题,深入研究了
随着GIS应用领域的扩大和时态GIS的发展,GIS栅格数据在模拟和预测土地荒漠化扩展、森林病虫害防治、火灾蔓延等领域中得到了较多的使用,但这些栅格数据具有很明显的时间特性,也
摘要:小学阶段的孩子们正处于天真烂漫、活泼好动、对新奇趣味化的东西充满探究欲望和热情的时期,教师在实际开展教学的过程中,要紧紧抓住学生的这一心理特点和诉求,想方设法营造出充满趣味化的语文课堂,以此激发学生学习兴趣,本文主要对当前教育背景下如何实现小学语文趣味课堂教学进行了探讨,希望能对有关老师提供一定的参考和帮助。  关键词:小学语文;趣味教学;评价  一、增强课堂导入环节的趣味性  良好的开端是
非平稳信号是一种在工程实践中非常常见的非线性、非稳定信号,广泛存在于海洋、气象、地震、生物医学工程、桥梁监测等实际过程中。而从非平稳信号中有效地检测出有用信号,不仅
主要介绍了薄皮甜瓜蔓枯病的症状、病原菌形态特征、发生发展规律及防治措施等,为甜瓜蔓枯病的防治提供参考。 This paper mainly introduced the symptoms of thin-skinned
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
随着遥感卫星技术快速的发展及其在各个领域广泛的应用,遥感地面接收与记录系统技术也随之不断提高。近些年来,网络与计算机等相关技术也在迅猛发展,如何利用这些新技术、新设备
合成孔径雷达(简称SAR)由于其在民用和军事方面的广泛应用,受到了越来越多的重视。SAR技术的飞速发展和SAR图像分辨率的不断提高,使SAR回波数据量和回波数据的数据传输率不断的
数据立方体计算是数据仓库实现的一项基本任务。数据立方体的全部或部分预计算可以大幅度降低查询响应时间,提高联机分析处理性能。然而,这种计算是一种挑战,因为它需要大量计算
学位
继往开来蓬勃发展rn邯郸市眼科医院(邯郸市第三医院)始建于1946年,前身是邯郸天主教会眼科诊所,历经70余年,由一个只有几十人的眼科小诊所发展成为以眼科为龙头,耳鼻咽喉头颈
期刊