视频理解相关论文
视频是信息社会中人们记录和反映现实生活的重要信息载体,包含丰富的语义信息。利用多媒体技术从包含多个场景活动的视频中定位出......
视频表征学习旨在学习有效的特征映射函数,实现将原始视频映射到新的特征空间,以便进行更高层次的视频内容理解(如视频动作识别等)。......
随着互联网技术的繁荣和视频技术的发展,视频内容正被越来越多的人们所青睐。每天,世界上都有大量的视频被拍摄、剪辑,并上传到互......
3维卷积神经网络(3D CNN)是近几年来深度学习研究中的热点,在计算机视觉领域取得了诸多成就。虽然研究多年且成果丰富,但目前仍缺少关......
随着监控摄像头的普及,基于视频数据的安防需求进步一步扩大。为了充分利用这些基础设施作为感知器官的能力,基于视频数据的行为识......
随着智能摄像头的广泛应用,逐渐完备的智能监控系统在银行,高铁站,机场,交通要道,街头巷尾等城市中的重要公共区域都有着大量部署......
如今每天都有海量的视频内容不断产生,传统的人工分析已经远远无法胜任这种量级的任务,因此自动化的视频分析算法变得非常重要。在......
视频时序动作检测的目标是定位出未剪辑视频中动作片段的开始、结束时间点,并进行动作类别的分类识别,可应用于视频分析、视频搜索......
随着视频理解研究的不断深入和应用范围的不断扩大,行为识别任务逐渐成为相关领域的研究热点之一。大多数应用场景中计算资源有限,......
随着人工智能技术的蓬勃发展尤其是以深度学习为代表的基础理论与工程实践的突破,智慧城市及安防相关产业也出现了跨越式发展,其中......
在日常生活中,视频监控无处不在,广场、火车站、住宅小区、交通道路等常见场所,分布着大大小小,不计其数的摄像头。视频监控,可实......
本文设计了一套以深度学习技术为基础,能对一段视频的内容进行自动化理解、给出内容结果并自动进行审核的系统,其在广播电视等媒体......
近年来,语义解析是计算机视觉研究领域的热门方向。通过卷积神经网络学习视觉信息的深层表达,该方法已经趋于成熟,但是视觉信息的......
视频字幕生成(video captioning)在视频推荐、辅助视觉、人机交互等领域具有广泛的应用前景.目前已有大量的视频英文字幕生成方法......
目的时序行为识别是视频理解中最重要的任务之一,该任务需要对一段视频中的行为片段同时进行分类和回归,而视频中往往包含不同时间......
自然场景视频中的人体行为识别问题是计算机视觉研究领域的重要课题之一,在视觉监控、视频检索、人机交互以及人体运动分析等诸多领......
视频的理解是一个高层语义信息与底层视觉特征信息自然融合的过程。如何有效地对视频信息进行分析,实现视频内容理解,并根据视频理解......
近些年来,随着智能终端和移动通信网络的普及,各类视频社交娱乐软件大幅兴起,伴随而来的是海量繁杂的视频数据。如何智能化处理这......
当前信息技术快速发展,视频因其携带丰富的信息内容而成为了当前人工智能研究的热点之一。视频处理技术在人类生活中有着广泛用途......
提出一种基于非参数化运动估计和图像配准的方法来进行相机运动条件下的前景提取.通过对视频帧和接近的训练背景图像进行非参数化......
由于监控中的行人检测存在背景复杂,目标尺度和姿态多样性及人与周围物体互相遮挡的问题,造成YOLOV3对部分目标检测不准确,会产生......
手语研究是典型的多领域交叉研究课题,涉及计算机视觉、自然语言处理、跨媒体计算、人机交互等多个方向,主要包括离散手语识别、连......
为解决计算机图形学和视觉领域的人体数据运动获取问题,提出一种从无标记点的单目视频恢复三维人体运动的方法.首先对人体侧影进行......
行为检测在自动驾驶、视频监控等领域的广阔应用前景使其成为了视频分析的研究热点。近年来,基于深度学习的方法在行为检测领域取......
首先,构造出能获得更丰富人体行为信息的四级图像序列结构,并分别用卷积神经网络进行处理,从而得到包含表观、运动、前景和背景信......
随着移动通讯技术的发展,网络上视频数据呈爆炸性增长,对于智能视频分析技术的需求日益增加。随着深度学习技术的应用,视频理解和......
综合理解视频内容和文本语义在很多领域都有着广泛的研究。早期的研究主要是将文本-视频映射到一个公共向量空间,然而这种方法所面......
视频数据分析将是人工智能技术应用的重要技术课题,而高效的视频理解方法更是大规模视频分析应用落地的基础。本文将阐述高效动作......
视频中人的动作分析与理解是计算机视觉和模式识别领域的热点问题,广泛应用于智能视频监控、人机交互、视频检索和视频摘要等领域......
随着机器人越来越多地参与到人类日常的生产与生活,人机交互问题引起了广泛的关注。在人机交互问题中,机器人感知外界环境的能力非......
针对目前局部描述方式中忽略邻点之间关系从而丢失邻域结构信息,以及忽略时空特征在时域和空域上变化具有差异性的问题,提出一种基......
随着互联网的迅猛发展,当前世界不断涌现出各种新兴的社交媒体,例如:Facebook,Flickr,Twitter,Instagram等等。而伴随着这些新的网......
多媒体视频中字幕方式对外语学习的作用机制得到了越来越多关注。本文在Mayer的多媒体学习理论和Lavie的知觉负载理论的基础上,通......
随着互联网的发展和网络流量成本廉价化,基于网络的交互方式从原来的文本逐渐向图像和视频等多媒体倾斜,对视觉图像和视频等数据的......
通过测试三种不同字幕呈现方式对外语学习者视频整体理解和词汇理解效果的影响,探究不同字幕的呈现方式对语言水平不同的外语学习......
目前行为识别方法更关注动作本身,但短视频中包含的信息比较少,需要利用视频中的多种特征信息,提高任务行为识别的准确率。因此,对......
计算机视觉的终极目标是使机器能够理解视觉媒体,包括绘画、照片和视频等。由于深度学习技术的高速发展,我们目前几乎可以很好地解......
近年来,伴随着网络带宽的迅速增长、存储技术的进步以及各种视频录制设备的普及,人们已身处一个视频数据爆炸性增长的时代。面对海......
受益于多媒体文化的迅速发展,多模态语言材料和影视视频材料被越来越多地运用于外语教学中。对二语习得者而言,以多感官的方式接触......
在第二语言多媒体学习环境下,越来越多的英语原声视频材料被应用于课堂之中,但纯正的口语输入环境的缺乏是一个难以解决的问题,导......
随着人工智能与物联网的发展,人体动作识别在智能视频监控、智能人机交互、虚拟现实和运动分析等领域的需求日益增加。然而由于动......
多媒体技术的发展使英文电影赏析成为促进大学英语教学的有效手段,而英文字幕也成为一种有效的用于提高EFL学生的视频理解水平的工......
计算机视觉(CV)是指赋予机器某种视觉洞察力,让机器具备视觉感知以及认知的能力。计算机视觉是人工智能领域最重要的研究方向之一,......