视频文本的提取

被引量 : 0次 | 上传用户:cse_gzzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的文本能够给视频检索和索引提供重要的辅助信息,有时视频中的文本包含了其它地方没有的信息,例如电影片头的字幕,有时,视频中的文本是一种重要而简洁的辅助信息,例如体育比赛中的得分股票价格。如果视频中的文本能够被有效地提取和识别,那么许多高层次的应用,例如视频摘要,就可以更好地实现。 论文对视频文本提取的几个方面,包括文本定位、文本跟踪、文本增强和文本分割进行了研究。与文档图像相比较,视频中的文本提取由于其较低的分辨率、复杂的背景、照明的变化、和位置、形状与颜色的不确定而具有很大的挑战性。 本文采用了一种压缩域与空域相结合的文本行定位方法,文本区域使用DCT块的纹理能量直接在DCT域检测,文本行根据文本区域差分图像的水平投影轮廓线来提取。 提出了一种基于M估计模板匹配的文本跟踪方法,匹配模板用LLT(Logical Level Technique)对文本区域进行粗分割得到,搜索窗口位置用MPEG-2比特流中的运动向量来估计,模板匹配的加速采用基于优胜者更新的多分辨率方法。 一种多帧融合的增强方法被用来提高文本与背景的对比度,论文根据文本区域中每个象素在时间域上的强度分布决定采用多帧平均方法还是采用多帧最小或多帧最大方法来增强文本区域。 提出了一种基于彩色笔画模型的文本分割算法,彩色笔画模型描述了字符在彩色空间的局部地形学特征,文本分割算法由文本区域二值化和连通区域二部分组成。
其他文献
随着科学和技术的迅猛发展,企业之间的竞争最终表现在人才竞争上。如何吸引、培养和使用人才,成为企业管理最重要而又最艰巨的工作。不少学者都表现出对建立以激励问题为中心
随着数字信号处理理论和计算机技术的发展,视觉运动目标跟踪已经成为模式识别、图像处理、计算机视觉、武器制导等领域研究的重要课题。目标跟踪把图像处理、自动控制、信息
投资环境是投资者普遍关注的一个问题。从改革开放来,柬埔寨经济迅速增长,为了有效地吸引外资,柬埔寨对投资环境不断的改善,并且给予了一些优惠政策。近几年来,柬吸引了不少
路径规划是AGV(Automated Guided Vehicles)控制中的关键问题之一,也是AGV导航的基本环节之一。论文主要对静态已知环境下的全局路径规划、动态未知环境下的局部路径规划分别
现代农业在迅速提高生产力的同时,也付出了诸如资源与能源的过度消耗,农业环境的破坏等巨大的代价。这些问题在我国表现得尤为严重。可持续的生态农业应运而生。因此,我国政
针对铁路建设中工程机械常见的机械伤害、电气系统引发的安全事故,以及铁路营业线机械化施工常见事故,深刻分析其原因,结合现场实际,提出从源头抓起,严把工程机械进场关;完善安全管
氮化硅薄膜是一种多功能材料,在许多领域有着广泛的运用:在微电子材料及器件生产中,氮化硅作为钝化膜、绝缘层和扩散掩膜;硅基太阳能电池中,氮化硅用作钝化膜和减反射膜;在硅
<正>中学生应该读什么书?应该读经典读名著。可是这样的回答解决不了问题。不妨换一个角度,看一看读书对于学生成长承担着怎样的任务:首先是读完一本书,理解了书册的内容,由
近几年我国深基坑的发展取得了巨大的进步,由于基坑工程不仅存在基坑本身的安全与稳定问题,而且还存在因土方开挖引起的周围地层移动而危及相邻建筑物、地下管线网和城市市政
自来水中人肠道病毒的存在已引起人们极大的关切和忧虑。本文报道了武汉东湖水和以东湖为水源的自来水中病毒和指示细菌的存在水平。水源水经过预加氯消毒、絮凝沉淀、砂滤和