基于目标检测与跟踪的视频辅助标注系统

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jumglezhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉技术的不断发展,视频类产品也逐渐走向智能化。人工智能算法通常需要大量样本数据进行训练,由此大量开源数据集应运而生。然而,在将人工智能算法应用于实际工程时,由于待处理问题具有不同的特征,仅使用公共数据集是不够的,还需要私有数据集更有针对性地训练。单纯使用人工标注的方式构建私有数据集,需要消耗大量的人力和时间成本。而现有的一些利用众包或抽样进行标注的系统又存在标注过程复杂、准确率低等缺点。为解决上述问题,本文设计并实现了一种基于目标检测与跟踪的辅助标注系统,帮助人工进行视频的半自动标注,降低了人工标注的工作量和难度,大幅提升标注效率。首先,本文对目标检测和目标跟踪算法进行研究。应用FasterR-CNN、YOLOv3和SSD三种目标检测算法分别与卡尔曼滤波跟踪算法进行组合,在每一帧视频中生成目标检测框和目标跟踪框,并使用匈牙利算法进行目标指派,生成该帧目标对应的标注信息。用户可根据视频选择合适的算法进行初始标注,以提高标注的精准度。其次,对关键帧进行提取,进行人工校验。本文采用镜头边界检测算法和自定义易错帧选择算法在标注算法计算的过程中提取出关键帧,并定义人工校验规则,结合提取的关键帧进行修正后,再重新初始化辅助标注算法,从而实现对整个视频的修正。最后,构建辅助标注系统,该系统实现对用户上传的视频进行辅助标注的功能。系统通过实现辅助标注算法,对视频进行初始标注,然后通过人工校验的方式修改关键帧中目标框的位置、大小等信息。标注完成后,用户可下载所需格式的标注文件。经测试表明,本系统能够对视频标注过程起到良好的辅助作用,大幅缩短了标注时间,具有很高的实用性。
其他文献
氢键有机框架(Hydrogen-bonded Organic Frameworks,HOFs)是一类通过氢键作用力自组装形成的新型多孔材料。尽管HOFs具有高结晶度、易合成、易纯化以及通过重结晶即可实现再生等诸多优点,但是氢键的柔性和弱相互作用,使得HOFs的结构稳定性仍不够理想且难以保持永久性孔道,这在很大程度上阻碍了 HOFs的发展与应用。针对上述问题,本论文通过向HOFs中引入金属-有机配位
水声通信作为海洋资源开发、国防安全建设的重要研究领域之一,已达到较高水平。以往通信速率高、传输距离远、可靠性高是人们对水声通信的要求,但随着国防需求的不断提高,合
近年来,卷积神经网络在数据挖掘和安全检测等方面得到广泛应用。然而,卷积神经网络在提供便利的同时,也非常容易受到对抗攻击的影响,这种攻击可以造成神经网络分类器对原始图像的错误分类。一旦有恶意攻击者将其应用于安全敏感性领域,例如人脸识别系统、无人驾驶工程和安防监控等,都将对社会及个人带来极其严重的后果。当前对于不同色调图像(包括黑白图像、彩色图像)的防御对抗模型在提升分类准确率上效果不佳。针对上述问题
论文结合科研项目研究了车载毫米波雷达天线,其内容概括如下:首先说明了文中所用到的相关概念,讨论了国内外研究现状及存在问题,阐述了车载毫米波雷达天线的选题背景和意义,论述了文中所用到的相关基础理论;其次对车载毫米波雷达天线进行了研究。具体研究工作为:1.车载毫米波雷达微带天线阵列设计设计了车载毫米波雷达微带天线阵列,采用微带天线组阵的方法实现高增益特性,对线阵使用切比雪夫功率分布降低其副瓣电平,并对
在油气勘探逐渐深入的今天,勘探的复杂度增加,对成像的精度要求也越来越高。逆时偏移成像方法基于其高精度成像的优点,已成为油气勘探研究的热点,该算法主要解决常规偏移算法无法实现精细构造成像的问题,为后续构造地质解释及油气定位提供较为准确的信息。逆时偏移算法基于双程波成像特性,能更好的表征地震波传播过程的各项特征,能更真实的反应地下介质信息,但巨大的数据存储量一直是制约其发展的主要因素。压缩感知作为具有
近年来,随着网络的迅速发展,对高质量社区进行挖掘和发现已经成为社会网络研究的一个热点。当前社区发现算法主要通过无向图进行研究,但在实际复杂网络中,链接关系时常表现出非对称性,比如Twitter的用户关注关系,文献网络的引用关系,网页之间的超链接关系等。目前为止社区发现领域已有很多优秀的划分方法,比如模块度优化算法,基于标签传播的社区发现算法等。这些方法多适用于非重叠社区,但很多社交网络比如本文实验
雷达高分辨距离像(HRRP)是宽带雷达目标散射点回波在雷达视线(LOS)方向上投影的矢量和。近些年来,HRRP凭借其易于获取、数据量小、处理简单、富含目标结构信息等优点,成为雷达自动目标识别(RATR)领域的研究热点之一。本文首先介绍了基于HRRP的RATR技术的历史背景与研究意义,并简要说明了本文的主要工作内容。随后,本文从传统卷积神经网络(CNN)结构入手,逐步介绍了三种基于CNN的HRRP目
随着我国工业化、城市化进程的持续推进,各种自然灾害与安全事故频繁发生,2020年春节前后爆发的新型冠状病毒肺炎更让各城市陷入沉寂。京津冀城市群是我国重要的经济增长极也是我国典型的人口、产业集聚地,为提高城市系统面临风险冲击的预警、抵抗与恢复能力,需要对其韧性发展能力进行评价。本文首先根据已有的理论研究对城市韧性的概念进行了界定,并以京津冀地区13个城市为研究对象,以2009—2018年为时间节点,
能源是主导世界经济的血脉,也是人类活动的基础。保障了能源的供应,其实就是保障人类的持续发展。然而随着科技革命和工业革命的高速发展,人类面临的不仅是石油、天然气和煤炭等化石能源的高度消耗,还需要治理由于过度开发而带来的日益严峻的环境污染等问题。太阳能作为最具开发潜力的清洁能源之一,其环保、高效以及可再生的优点越来越得到世界各国的青睐。太阳能开发的形式有多种多样,例如集中式光伏发电站、“渔光互补”发电
以二维二硫化钼(MoS2)为代表的过渡金属二硫化物,因其卓越电学和光学性质而在材料科学领域大放异彩。本文详细地研究了通过化学气相沉积法制备出的二维MoS2异质结在不同角度的偏振光激发下,谷极化效应对其光电特性的影响。此外,还通过扫描隧道谱(STS)探究了基于二维MoS2异质结在偏振光激发下能带结构的变化规律,研究谷极化效应对二维MoS2电学结构的影响。本文主要分为5个部分:第一章首先介绍了二维Mo