面向视频动作预测任务的数据和方法分析

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 1次 | 上传用户:liongliong556
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来计算机视觉方向的算法越来越多地将研究目光从图片转向了视频,人们设计了一系列子任务促使算法更好地理解视频内容,包括以人类活动为中心的动作识别、动作定位、动作预测等。在深度学习的推动下,动作识别任务的精度被一步步提升,然而动作预测仍然是个大难题,预测总是充满着不确定性,如何对视频中的动作模式更好地建模仍然有待探索。本研究针对数据所做的标注分析,并非提出一个新数据集,而是对现有数据集扩展和再探讨,目的在于研究预测任务的可解程度及数据中可能存在的问题。我们采样了部分数据,评估出其中可预测样本的比例大约占70%,人工预测的精度与基线模型基本持平,大约是40%。我们对人工结果与模型结果做了细致的对比和案例分析,找出了视频中的动作序列中可能存在的结构化模式,提供了一种更深入的视角认识数据集与该任务。其次我们详细分析了任务所用的指标和相关实验现象,指出了平均精度指标的局限性。最后,我们从预测不确定性问题出发,以人工标注的预测结果为训练数据,对模型进行微调,在整体精度不显著下降的同时,平均精度上提升了约2个百分点。我们的方法以较小的模型和较短的输入,在验证集上取得了第二好的结果。本研究从根本上对预测问题和Epic-Kitchens100数据集进行了剖析,能够指导人们更好地分析实验结果,并进一步给预测任务乃至识别任务带来启迪,推动数据集和任务设定的完善和迭代。
其他文献
液体的界面张力(IFT)是作用在单位长度液体界面上的收缩力,当形成界面的两相中有一相是气相,则此时界面张力可被称作表面张力。IFT在工业、生物医学和合成化学应用中发挥着重要的作用。在工业流程中,例如评估洗涤剂品质、研制新型涂层配方、协助石油开发三次采油(EOR)技术等领域都需要IFT测量。传统针对表面张力的测量方法有动态张力测量法和静态张力测量法两类,比较有代表性的静态表面张力测量法有Du Noü
学位
随着深圳地区城市化发展进程不断加快,高层建筑群数量不断增多,极端天气引发的垂直面强风影响日益加剧。为探索深圳垂直方向上的风速变化规律,预防登陆台风等灾害来临之际,高层建筑无法抵挡强风侵袭的隐患问题,本研究以2016年-2019年深圳市气象梯度塔、平安大厦以及中心公园自动站的小时风速观测数据为基础,分析了该地区包括10分钟平均风速(平均风)和3秒平均风速(阵风)在内的两种风速与高度变化之间的关系。研
学位
实现电极材料可逆多电子反应是提高电池能量密度的重要途径。聚阴离子型磷酸盐正极材料因具有稳定的三维网络框架结构、快速的Na+传输通道以及适宜的工作电压等突出优点,成为一类极具研究价值和应用前景的正极材料。但因该类材料的本征电子电导率和离子电导率差等缺陷制约了其实际应用。因此,通过改善这些缺陷,进而提升材料的电化学性能,一直是该领域研究的热点问题。在目前已知的钠离子电池正极材料中,钠超离子导体型(NA
学位
益生菌是一类庞大的、异质性的细菌群,通过其代谢活动和与宿主细胞分子相互作用对人体健康有益,从而受到人们的广泛关注。目前益生菌制剂普遍存在着活菌数量低,不耐储存,不能有效发挥益生功能等问题,限制了其发展。真空冷冻干燥技术虽然最大化的保证了菌体的活力,但生产成本高,而喷雾干燥技术成本低,生产率高,是工业化生产益生菌微胶囊的首选方法,因此本研究利用喷雾干燥的方法,以副干酪乳杆菌FN345作为目标菌株,通
学位
温度作为最常见的物理学变量,它涉及到了我们日常生活的方方面面,温度的准确测量在大部分科学实验和疾病监测中起着至关重要的作用。目前常规的温度计由于其具有尺寸难以微型化和响应速度慢等不足,并不适用于生物医学研究和极端环境的动态监测,而高灵敏度的非接触测温技术正好弥补了这一缺陷。对比其他几种非接触式温度计,稀土发光测温材料依赖荧光与温度的关系,具备低毒性、高分辨率,组织穿透性强等优点而被广泛应用。本课题
学位
嗜热链球菌(Streptococcus thermophilus,S.thermophilus)是食品工业常用的乳酸菌菌种之一,广泛应用于发酵乳生产。γ-氨基丁酸(gamma-aminobutyric acid,GABA)有降血压、增强免疫力、改善睡眠、缓解焦虑等功能。该菌种部分菌株能够合成GABA,但当前主要集中在应用研究,而GABA相关合成机制研究较少。因此明确嗜热链球菌中GABA生物合成机制
学位
m6A是一种RNA上的表观遗传修饰,参与真核生物基因表达的转录后调控。研究表明,各种组织器官中,脑组织有最为丰富的m6A含量,这提示RNA甲基化修饰在中枢神经系统(Central Nervous System,CNS)的发育及功能上可能起着关键的作用。参与m6A修饰过程的加甲基、去甲基和识别功能的蛋白主要是写入蛋白、擦除蛋白和阅读蛋白,这些功能蛋白在CNS中也有普遍的高表达。过去十多年,大家围绕m
学位
全球化背景下的当今,人们对于世界已进入普遍交往这一客观现象达成共识,各个国家都处于普遍交往的联系中。发展中国家在一定程度上摆脱了过去百年的时间里,发达国家对其全方位的碾压,享受并利用到经济全球化的红利,实现了以经济发展为代表的多方面大幅度的进步,发展中国家相应地想要在国际交往中获得更多利益以及话语权。发达国家感受到新兴国家的威胁,为保持自己的领先地位,不愿意放弃自己的固有利益,导致国际交往不正义的
学位
甜菜是重要的产糖作物,但因其为无限花序,并且花蕾较小,人工授粉难度较大。利用甜菜细胞质雄性不育(cytoplasmic male sterility,CMS)杂交可以有效解决这一问题,提高甜菜产糖量。目前,关于甜菜CMS的细胞学、转录组学、蛋白质学都有相关研究,但是在表观遗传学方面还需要进一步研究。DNA甲基化是重要的表观修饰方式之一,是研究植物雄性不育的重要方法。本研究通过分子标记技术鉴定甜菜育
学位
计算机科学的进步和计算力的发展带来了人工智能的第三次浪潮,人工智能技术正影响着社会多方面的变革,创新型医疗健康方法正是其焦点领域之一。但人工智能在医学领域细分方向上的应用始终面临着一些不容忽视的技术难题,其中标记数据集匮乏和针对性模型缺乏的问题尤为突出。鉴于脑血管相关疾病在临床上量化、诊断、监测、治疗及预后等的迫切需求,本工作聚焦于人体生命活动中极为重要的脑血流自动调节领域,针对患者个体脑血流自动
学位