【摘 要】
:
时钟识读,尤其是实时识读视频中的多个时钟,不仅是一个面向应用的研究问题,因为时间信息对于视频分析、视频处理以及视频检索等应用来说是一种关键信息,而且是视频文本识读领
论文部分内容阅读
时钟识读,尤其是实时识读视频中的多个时钟,不仅是一个面向应用的研究问题,因为时间信息对于视频分析、视频处理以及视频检索等应用来说是一种关键信息,而且是视频文本识读领域一个很有挑战性的问题,主要表现为两个方面。第一个具有挑战性的方面是时钟数字的定位问题,现有的基于秒像素周期性方法对于定位视频中单时钟秒位数字区域来说是一种很好的方法,但是该方法不适用于定位多时钟的情况,因为多时钟存在秒数字同步变化的情况,并且该方法存在需要手动设置阈值参数、要求输入的视频长度较长等方面的不足。第二个具有挑战性的方面是时钟数字的识别问题,现有的字符识别算法的准确率不能达到100%,不能满足应用的要求。针对以上两个方面的挑战,本文提出了一种基于机器学习的时钟识读方法,该方法不仅可以识读视频中的单时钟,还可以识别视频中的多时钟。针对时钟数字定位方面的挑战,本文提出了一种机器学习算法,该算法利用了秒像素周期性和背景像素稳定性的特征。与现有的方法比较,本文提出的算法不仅可以定位视频中单时钟的秒数字区域,还可以定位视频中多时钟的秒数字区域,同时缩短了要求输入的视频的长度,由于使用了机器学习的方法,该算法不需要手动设置阈值参数。针对时钟数字识别方面的挑战,本文提出了基于3个数字序列的CNN识别算法,该算法利用了深度学习算法,同时结合了领域知识能够很好的识别时钟数字。实验结果表明本文提出的基于机器学习的时钟识读算法有以下3个方面的优势:(1)能够识读单时钟和多时钟;(2)在计算开销很低的情况下正确率可以达到100%;(3)缩短了要求输入的视频的长度。
其他文献
美术是一门培养学生动手能力与思维能力的艺术课程,对于提高学生的艺术素养具有重要作用。文章分析美术教学中存在的问题,提出培养学生动手能力的有效途径:利用手工制作,提高
作为理科的初中化学教学,试题研究日益受到重视,试题研究的基础是选好试题,试题的选择本身就是一个能力提升过程。理解命题思路是试题研究的一个重点,而面向学生则是试题研究
某铂钯矿位于非洲津巴布韦境内,运用MLA等仪器和手段对其进行了系统的工艺矿物学研究.研究结果表明,矿石中的铂钯矿物种类较多,共有17种,它们的嵌布粒度均较细.矿石中的铂钯
就三甲医院医疗设备计量检定的重要性进行分析,阐明医疗计量检定与医疗设备的质量和安全存在着相互依存的关系,并且介绍了三甲医院医疗设备计量检定工作中存在的问题以及一些
本报告旨在探讨泰特勒翻译三原则下译者翻译《在我们属于你之前》的过程以及在翻译书中儿童语言时的发现和问题。本篇翻译报告材料节选自美国畅销小说作家丽莎·温盖特的历史小说。该小说按照真实事件改编,反映了美国20世纪20年代至50年代,大量儿童遭到拐卖与家人分离的社会现象。该小说虽然不是一部儿童文学作品,但是作者对主角童年生活的细致生动描述在书中占据了相当大的比重,并对情节发展起到了决定性作用,因此译者将
提出了一种反射型太赫兹超材料极化转换器。该极化转换器结构单元由典型的三层结构组成,上、下两层为金属层,中间为介质层,顶层金属层由一个开口谐振环和一个镂空圆盘组成。
水平井分段多簇压裂是目前非常规储层开发的有效手段,但现场生产测试结果表明,相当一部分的射孔簇对产量完全无贡献。文中基于CZM模型和伯努利方程建立了考虑射孔孔眼摩阻的
传染性非典型肺炎(非典)为一种传染性强的呼吸系统疾病,世界卫生组织(WHO)认为它是由一种冠状病毒亚型变种引起,并将传染性非典型肺炎称为严重急性呼吸道综合征(Severe Acute
就当代大学生所应具备的基本能力及其培养途径进行了探讨。能力是个体顺利完成某种活动所必须具备的心理特征,是个体适应社会、取得成功的基本心理素质。社会竞争压力的日益
战略大气区指的是具有战略性生产(储备)基地作用的大气区。战略大气区包括五个方面的结构要素:天然气生产(储备)基地系统、天然气管网枢纽系统、天然气市场培育系统、运行管理系统