视频理解相关硕士博士期刊学术论文

视频理解相关论文

跨模态视频片段定位方法研究

视频是信息社会中人们记录和反映现实生活的重要信息载体,包含丰富的语义信息。利用多媒体技术从包含多个场景活动的视频中定位出......

学位

视觉与语言视觉与音频视频片段定位视频理解跨模态学习

基于Transformer的视频表征学习

视频表征学习旨在学习有效的特征映射函数,实现将原始视频映射到新的特征空间,以便进行更高层次的视频内容理解（如视频动作识别等）。......

学位

视频理解视频动作识别视频表征视频Transformer 自注意力机制

基于跨模态语义对齐的视频时刻检索研究

随着互联网技术的繁荣和视频技术的发展,视频内容正被越来越多的人们所青睐。每天,世界上都有大量的视频被拍摄、剪辑,并上传到互......

学位

视频时刻检索视频理解跨模态对齐时刻定位

三维卷积神经网络及其在视频理解领域中的应用研究

3维卷积神经网络（3D CNN）是近几年来深度学习研究中的热点，在计算机视觉领域取得了诸多成就。虽然研究多年且成果丰富，但目前仍缺少关......

期刊

视频理解深度学习 3维卷积神经网络网络结构

基于深度神经网络的视频行为识别方法研究

随着监控摄像头的普及,基于视频数据的安防需求进步一步扩大。为了充分利用这些基础设施作为感知器官的能力,基于视频数据的行为识......

学位

深度学习时序建模行为分析视频理解

面向城市智能监控系统的异常行为预警关键技术研究

随着智能摄像头的广泛应用,逐渐完备的智能监控系统在银行,高铁站,机场,交通要道,街头巷尾等城市中的重要公共区域都有着大量部署......

学位

异常检测行为识别时空定位视频理解图卷积网络

视频时序动作定位及语句查询定位技术研究

如今每天都有海量的视频内容不断产生,传统的人工分析已经远远无法胜任这种量级的任务,因此自动化的视频分析算法变得非常重要。在......

学位

深度学习计算机视觉视频理解行为检测动作定位

视频时序动作检测技术研究及其应用

视频时序动作检测的目标是定位出未剪辑视频中动作片段的开始、结束时间点,并进行动作类别的分类识别,可应用于视频分析、视频搜索......

学位

计算机视觉视频理解时序动作检测自注意力机制成对损失

基于深度学习的行为识别方法研究

随着视频理解研究的不断深入和应用范围的不断扩大,行为识别任务逐渐成为相关领域的研究热点之一。大多数应用场景中计算资源有限,......

学位

视频理解行为识别卷积神经网络混合卷积

基于交互信息的动作识别模型

随着深度网络在各图片任务上取得巨大成功,越来越多研究将重心放在更为复杂的视频理解任务上。动作识别任务的目的是对视频中所有......

学位

视频理解动作识别深度学习交互关系点乘注意力

基于表观运动记忆一致性的视频异常事件检测

随着人工智能技术的蓬勃发展尤其是以深度学习为代表的基础理论与工程实践的突破,智慧城市及安防相关产业也出现了跨越式发展,其中......

学位

异常检测视频理解先验信息多模态一致性

面向视频的目标检测与行为识别

在日常生活中,视频监控无处不在,广场、火车站、住宅小区、交通道路等常见场所,分布着大大小小,不计其数的摄像头。视频监控,可实......

学位

目标检测行为识别多目标跟踪深度学习视频理解

人工智能在视频内容审核方面的应用

本文设计了一套以深度学习技术为基础,能对一段视频的内容进行自动化理解、给出内容结果并自动进行审核的系统,其在广播电视等媒体......

期刊

人工智能视频理解内容审核深度学习

基于视觉的特征学习、优化及语义解析

近年来,语义解析是计算机视觉研究领域的热门方向。通过卷积神经网络学习视觉信息的深层表达,该方法已经趋于成熟,但是视觉信息的......

学位

机器视觉深度学习深度哈希人脸识别视频理解

跨语言知识蒸馏的视频中文字幕生

视频字幕生成(video captioning)在视频推荐、辅助视觉、人机交互等领域具有广泛的应用前景.目前已有大量的视频英文字幕生成方法......

期刊

中文字幕生成视频理解知识蒸馏视频中英字幕数据集特权信息

跨语言知识蒸馏的视频中文字幕生成

视频字幕生成(video captioning)在视频推荐、辅助视觉、人机交互等领域具有广泛的应用前景.目前已有大量的视频英文字幕生成方法......

期刊

中文字幕生成视频理解知识蒸馏视频中英字幕数据集特权信息

特征金字塔结构的时序行为识别网络

目的时序行为识别是视频理解中最重要的任务之一,该任务需要对一段视频中的行为片段同时进行分类和回归,而视频中往往包含不同时间......

期刊

时序行为识别特征金字塔深度学习计算机视觉视频理解

自然场景视频人体行为识别关键技术研究

自然场景视频中的人体行为识别问题是计算机视觉研究领域的重要课题之一，在视觉监控、视频检索、人机交互以及人体运动分析等诸多领......

学位

图像识别人体跟踪视频理解图像处理

面向视频理解的认知建模及其应用研究

视频的理解是一个高层语义信息与底层视觉特征信息自然融合的过程。如何有效地对视频信息进行分析，实现视频内容理解，并根据视频理解......

学位

视频理解认知体系语义轨迹事件探测关联分类演化式学习

基于多模态细粒度关联的视频描述定位

视频描述定位旨在让机器根据用户提供的文本描述,在一个完整的视频中自动定位到和给定的文本描述最相关的特定视频段。该任务是计......

学位

视频描述定位多媒体分析视频理解弱监督学习多任务学习

用于视频时序动作检测的上下文级联网络设计与实现

近些年来,随着智能终端和移动通信网络的普及,各类视频社交娱乐软件大幅兴起,伴随而来的是海量繁杂的视频数据。如何智能化处理这......

学位

视频理解深度学习动作识别时序动作检测

用于边缘设备视频场景理解的轻量化语义分割网络

当前信息技术快速发展,视频因其携带丰富的信息内容而成为了当前人工智能研究的热点之一。视频处理技术在人类生活中有着广泛用途......

学位

视频理解语义分割张量压缩边缘计算

相机运动条件下的视频前景提取

提出一种基于非参数化运动估计和图像配准的方法来进行相机运动条件下的前景提取.通过对视频帧和接近的训练背景图像进行非参数化......

期刊

前景提取背景图像背景减除视频理解 foreground segmentation background image background subtra

改进YOLOV3算法的视频目标检测

由于监控中的行人检测存在背景复杂,目标尺度和姿态多样性及人与周围物体互相遮挡的问题,造成YOLOV3对部分目标检测不准确,会产生......

期刊

目标检测 YOLOV3算法斥力损失深度学习视频理解 target detection YOLOV3 algorithm repulsion loss de

字幕类型对英语视频理解及词汇习得的影响

多媒体技术的发展丰富了大学英语教学手段,英语视频越来越多地被使用于课堂教学,因而英语字幕也成为一种很好的用于提高学生视听说......

期刊

字幕类型英语视频理解伴随性词汇习得影响

手语识别、翻译与生成综述

手语研究是典型的多领域交叉研究课题,涉及计算机视觉、自然语言处理、跨媒体计算、人机交互等多个方向,主要包括离散手语识别、连......

期刊

视频理解机器翻译离散手语识别连续手语翻译手语视频生成

单目视频人体三维运动高效恢复

为解决计算机图形学和视觉领域的人体数据运动获取问题,提出一种从无标记点的单目视频恢复三维人体运动的方法.首先对人体侧影进行......

期刊

三维恢复运动跟踪姿态恢复视频理解 3D recovery motion tracking pose recovery video understandin

基于深度学习的视频识别研究

由于视频识别在视频监控、视频搜索、视频推荐等实际视频理解应用中的重要作用,受到了计算机视觉领域的广泛关注。近年来,随着互联......

学位

视频理解模式识别深度学习

基于深度学习的行为检测方法综述

行为检测在自动驾驶、视频监控等领域的广阔应用前景使其成为了视频分析的研究热点。近年来,基于深度学习的方法在行为检测领域取......

期刊

视频理解行为检测深度学习弱监督学习 video understandingaction detectiondeep learningweakly supe

基于多级图像序列和卷积神经网络的人体行为识别

首先,构造出能获得更丰富人体行为信息的四级图像序列结构,并分别用卷积神经网络进行处理,从而得到包含表观、运动、前景和背景信......

期刊

人工智能行为识别视频理解卷积神经网络 artificial intelligence action recognition video understan

视频中动作识别任务综述

随着移动通讯技术的发展,网络上视频数据呈爆炸性增长,对于智能视频分析技术的需求日益增加。随着深度学习技术的应用,视频理解和......

期刊

视频理解动作识别行为分析深度学习 video understandingaction recognitionevent analysisdeep lear

基于聚类网络的文本-视频特征学习

综合理解视频内容和文本语义在很多领域都有着广泛的研究。早期的研究主要是将文本-视频映射到一个公共向量空间,然而这种方法所面......

期刊

召回模型模态融合聚类网络视频理解 Recall modelModal fusionClustering networkVideo understandin

高效动作视频特征学习的研究方法

视频数据分析将是人工智能技术应用的重要技术课题,而高效的视频理解方法更是大规模视频分析应用落地的基础。本文将阐述高效动作......

期刊

视频分析视频特征冗余性应用落地视频理解人工智能技术应用视频数据分析动作

视频中人的动作分析与理解

视频中人的动作分析与理解是计算机视觉和模式识别领域的热点问题,广泛应用于智能视频监控、人机交互、视频检索和视频摘要等领域......

学位

视频理解动作表示动作识别中层特征原子动作结构化判别式模型

视频中人体姿态估计、跟踪与行为识别研究

随着机器人越来越多地参与到人类日常的生产与生活,人机交互问题引起了广泛的关注。在人机交互问题中,机器人感知外界环境的能力非......

学位

人体模型人体姿态估计行为识别视频理解

人体行为识别局部描述方式

针对目前局部描述方式中忽略邻点之间关系从而丢失邻域结构信息,以及忽略时空特征在时域和空域上变化具有差异性的问题,提出一种基......

期刊

特征描述行为识别时空纹理描述视频理解行为分类 feature descriptionbehavior recognitionspatiotemporal

基于视觉信息分析的图像和视频理解及检索

随着互联网的迅猛发展,当前世界不断涌现出各种新兴的社交媒体,例如：Facebook,Flickr,Twitter,Instagram等等。而伴随着这些新的网......

学位

图片重排序图像检索范本模型显著图模型 ExSM Facebook Flickr 视频理解权重模板时空模板人类动作识别

英语多媒体视频阅听过程中的知觉负载与选择性注意——以视频字幕呈现量对阅听理解的影响为例

多媒体视频中字幕方式对外语学习的作用机制得到了越来越多关注。本文在Mayer的多媒体学习理论和Lavie的知觉负载理论的基础上,通......

期刊

注意力分配多媒体字幕视频理解

跨图像视觉语义的挖掘研究

随着互联网的发展和网络流量成本廉价化,基于网络的交互方式从原来的文本逐渐向图像和视频等多媒体倾斜,对视觉图像和视频等数据的......

学位

跨图像语义共有类别分割共有类别发现视频理解动作检测

字幕的不同呈现方式对外语学习者视频理解效果的影响

通过测试三种不同字幕呈现方式对外语学习者视频整体理解和词汇理解效果的影响,探究不同字幕的呈现方式对语言水平不同的外语学习......

期刊

字幕关键词字幕外语学习者视频理解

联合场景和行为特征的短视频行为识别

目前行为识别方法更关注动作本身,但短视频中包含的信息比较少,需要利用视频中的多种特征信息,提高任务行为识别的准确率。因此,对......

期刊

场景识别行为识别字典学习深度学习视频理解

视频理解中人体动作的细粒度表示与应用

计算机视觉的终极目标是使机器能够理解视觉媒体,包括绘画、照片和视频等。由于深度学习技术的高速发展,我们目前几乎可以很好地解......

学位

视频理解细粒度动作表示视觉关注时序建模语义挖掘

基于深度学习的时序动作检测研究

近年来,伴随着网络带宽的迅速增长、存储技术的进步以及各种视频录制设备的普及,人们已身处一个视频数据爆炸性增长的时代。面对海......

学位

深度学习时序动作检测卷积神经网络视频理解

字幕的不同呈现方式对汉语词汇附带习得和视频理解的影响

受益于多媒体文化的迅速发展,多模态语言材料和影视视频材料被越来越多地运用于外语教学中。对二语习得者而言,以多感官的方式接触......

期刊

字幕输入方式视频理解词汇附带习得

字幕类型对高中生英语视频理解和附带词汇习得的影响

在第二语言多媒体学习环境下,越来越多的英语原声视频材料被应用于课堂之中,但纯正的口语输入环境的缺乏是一个难以解决的问题,导......

学位

字幕类型学习风格视频理解附带词汇习得

基于深度学习的动作识别研究与实现

随着人工智能与物联网的发展,人体动作识别在智能视频监控、智能人机交互、虚拟现实和运动分析等领域的需求日益增加。然而由于动......

学位

动作识别深度学习特征表达特征融合视频理解

有、无字幕两种版本的不同观看顺序对视频理解效果的实证研究

多媒体技术的发展使英文电影赏析成为促进大学英语教学的有效手段,而英文字幕也成为一种有效的用于提高EFL学生的视频理解水平的工......

期刊

字幕视频理解播放顺序

无人系统之“眼”——计算机视觉技术与应用浅析

计算机视觉(CV)是指赋予机器某种视觉洞察力,让机器具备视觉感知以及认知的能力。计算机视觉是人工智能领域最重要的研究方向之一,......

期刊

计算机视觉图像理解目标检测视频理解行为识别视觉描述人工智能

基于视觉信息的推荐系统研究

数据稀疏性问题一直是推荐系统中的一个难题,但目前为止仍然没有得到很好的解决。实际的推荐系统获取到的数据往往比较稀疏,传统的......

学位

视觉信息电影推荐视频理解概率矩阵分解文本信息

看过本文同时还关注