基于深度学习的视频中的体育类型检测技术的研究

被引量 : 6次 | 上传用户:aiming6946s
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在视频信息快速膨胀的今天,如何快速有效的对视频进行标注,快速定位出视频关键内容是多媒体处理和计算机视觉领域的一大挑战,视频热点内容检测也因此成为最新的研究热点之一。深度学习(deep learning)在计算机视觉领域取得了辉煌的成绩,多层CNN模型已经广泛应用于图像分类、物体检测、人脸检测和识别等领域。本文深入分析了深度卷积网络在体育类型检测中的应用,结合迁移学习的概念,成功解决了CNN模型在小规模数据集上的优化问题,提出了多种迁移学习方法,利用CNN模型在ImageNet大规模标准数据集上训练的模型检测体育类型。作者使用了预训练结合模型微调的方法,使得CNN模型既保留了对复杂场景分分辨能力,又能够很好的处理体育类型场景和其他场景,间接验证的深度模型具有较强的泛化能力。(Google距离和WordNet距离的引入,很好的将图像语义和文本语义结合在一起,通过文本相似度推算图像语义,很好的解决了跨数据集分类的问题。同时,将CNN模型作为特征提取器,采用相同的简单分类器,与传统的手工设计的特征相比较,极大的提高的深度模型的适用性,同时试图将深度模型与传统机器学习算法结合在一起。针对深度模型过于抽象,内部特征不够透明,本文设计了反卷积网络,将深度模型提取的高层抽象特征重构到RGB空间,从而实现对深度网络的可视化,为优化和修改模型提供依据。同时,利用反卷积网络,本文分析了CNN网络中每一层学习到的特征,研究CNN网络的特征抽象过程,直观的展示了CNN学习到的part信息。此外,本文分析了单个神经元的重构信息,发现只需要单个神经元就可以重构出某些关键的part信息,因此如何有效的利用CNN提取的特征是提升网络性能的关键。同时,根据视频内容的连续性,提出了一些简单的平滑去噪和过滤算法,去除噪声片段,使得最终标注的视频片段更加纯净和连贯。
其他文献
自上世纪90年代以来,人民币汇率经历了频繁的调整和变动。尤其是2000年后,随着我国经济的平稳、持续和快速发展,外汇储备高速增长,人民币显示出较大的升值压力,而当时我国实
逻辑电路与单片机课程是高校电子和计算机相关专业学生的必修课程。然而,在电路仿真实验领域长期由国外软件垄断。随着国家级虚拟仿真实验教学中心的建设,自主研发逻辑电路与
在我国经济、人口分布不均的大背景下,东部地区经济发展程度高,金融机构从电子银行到实体网点全面覆盖这些地区;而在西部农村地区,由于基础建设落后等客观原因,金融覆盖程度严
我国未成年人犯罪已然成为社会突出问题,为减少和控制犯罪,理论界呼吁借鉴域外发达国家构建中国的暂缓起诉制度,经过多年实践试点的经验总结,全国人大最终在新《刑事诉讼法》
随着移动互联网的快速发展,无线联网尤其是基于Wi-Fi技术的无线联网及相关应用已与人们的生活密切相关。本课题设计了一种基于ARM11的嵌入式终端,配置Wi-Fi、摄像头等功能模
在新知识日新月异、新技术层出不穷的互联网时代,专业技术人员团队已成为企业技术创新普遍使用的组织单元。但外部环境的动态变化、专业技术任务的模糊复杂,使得专业技术人员
随着网络带宽和视频技术的提升,视频会议的视觉效果已经越来越好,目前的视频会议系统主要有三种类型,第一种是价格非常高,主要由大型MCU等硬件组成的大型会议系统;第二种是价
创业对于一个国家和地区的经济发展繁荣,人民生活水平的提高,及社会的不断进步具有至关重要的意义。创业团队的目标承诺,即创业过程中的坚持、决心和毅力,被认为是创业获得成
随着改革开放的深化,中国对外贸易量持续增长,跨国合作与竞争也屡见不鲜,因此对于翻译人才的需求都比以往更甚。以往关于“黑龙江省翻译人才市场”话题诸多见于报端,很少有深层