基于视觉的手势交互关键技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:forlichking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉技术和智能终端设备的快速发展,基于视觉的手势交互因为其自然、友好、方便等优点成为了一种被广泛使用的人机交互方式,其中的关键技术主要包括基于视觉的手势识别、估计与认证,它们之间彼此联系紧密,长期以来都是学术界与工业界的研究热点。手势交互时,图像或视频中手部区域占比较小且手部关节灵活度非常高,基于视觉的手势识别、估计与认证在手势图像或视频处理与分析中面临图像分辨率低、视角多样性、指间相似与遮挡、人手快速运动造成运动模糊等问题,这些都给基于视觉的手势交互带来了极大的挑战。为此,在手势识别与估计方面,本文围绕如何设计兼顾准确性与实时性的手势识别与估计算法展开深入的研究。而在手势认证方面,本文同时在数据集与算法层面进行了广泛的研究,以期推动该领域的进一步发展。总体而言,本文的主要成果和贡献包括以下四个方面:(1)提出了一种基于人手几何特征和Fisher向量的静态手势识别方法。该方法构建了一种新颖的2D手形特征表示以同时满足识别精度与效率的要求。其核心思想在于为手的每个轮廓点提取一个具有旋转与尺度不变性的局部描述符,并使用Fisher向量编码方法对所有的局部描述符进行编码,从而得到2D手形的Fisher向量表示,最后采用SVM分类器对得到的Fisher向量进行分类。在五个公开数据集上的实验结果表明,与之前的传统方法和主流的深度学习方法相比,该方法在识别精度与效率之间能取得更好的平衡。(2)提出了一种基于特征协方差矩阵的动态手势识别方法。该方法为基于不同输入模态数据(包括RGB手势视频、深度手势视频和人手骨架运动序列)的动态手势识别提供了一个统一的框架。其核心思想在于对手部的兴趣点进行跟踪并提取表征位置和运动等信息的局部描述符,然后使用特征协方差矩阵将整个动态手势中的所有局部描述符进行融合构成一个低维紧凑的特征协方差矩阵描述符,最后采用SVM分类器对得到的特征协方差矩阵描述符进行分类。在三个不同模态的动态手势数据集上的实验结果表明了该方法在同时考虑精度与效率的基础上相较之前的传统方法和主流的深度学习方法更有优势。(3)提出了一种基于关节图推理和像素-偏移量预测网络的3D手势估计方法。该方法使用一种稠密预测的方式从人手深度图像中估计关节点的uvz坐标,并直接使用关节点的uvz坐标进行端到端的训练,有效地结合了基于直接回归和基于稠密预测方法的优点。该方法主要创新点在于所提出的两个核心模块:关节图推理(JGR)模块和像素-偏移量(P2O)预测模块,其中JGR模块用于增强像素的特征表达能力,P2O预测模块用于预测像素到关节点的偏移向量。在三个公开数据集上的测试结果表明了该方法在模型大小、估计精度以及推理速度等多方面具有明显的优势。(4)构建了一个目前为止最大规模的面向动态手势认证的动态手势数据库并提出了一种基于改进双流卷积网络的动态手势认证方法。为了促进基于视觉的动态手势认证研究的发展,本文构建了一个大规模数据集,其包含193个用户的多达29,160个动态手势视频,并在该数据集上进行了全面的基准实验与分析。另外,本文在对现有的面向动态手势认证的双流卷积网络进行深入分析后,提出了一系列的改进方案,并在此基础上重新设计了一种改进的双流卷积网络模型,其在自建的数据集上取得了显著的性能提升。综上所述,本文对三类关键的基于视觉的手势交互技术:手势识别、估计与认证展开了深入研究,提出了基于Fisher向量的静态手势表示、基于特征协方差矩阵的动态手势表示、面向3D手势估计的关节图推理和像素-偏移量预测网络和面向动态手势认证的改进双流卷积网络。在多种类型的手势数据集上的实验结果证明了本文所提出的各种方法的有效性。
其他文献
在水体中重金属离子难以生物降解,会对生态环境和人体健康造成威胁。因此,人们采用不同方法脱除在水体中重金属离子,其中,黏土基吸附材料应用尤为广泛。伊利石/蒙皂石混层黏土(伊/蒙黏土)是一种分布广泛且储量丰富的不规则间层(混层)黏土矿物,然而,将伊/蒙黏土应用于重金属离子吸附的研究鲜见,尤其是纳米粒级伊/蒙黏土及其复合材料。本论文构建和制备了含无机纳米颗粒(四氧化三铁)和/或有机质聚合物(3-氨丙基三
我国的石油与天然气对外依存度高,使我国一次能源长久以来以煤为主。丰富的煤炭资源使煤化工产业得到了快速的发展,一批商业化运行的新型煤化工项目落地建成。然而,煤和化工产品之间的氢碳原子不匹配导致了煤炭资源利用率低和碳冗余,使煤化工面临着高碳排放和高能耗问题。本文以典型的煤制甲醇过程为研究对象,调研了某煤化工厂的煤气化和煤焦化装置,发现将气化和焦化两个过程进行耦合可以实现煤炭的分级分质利用。在此基础上,
柔性薄壁椭圆轴承(Flexible thin-wall elliptical bearing,FTEB)是谐波减速器中波发生器的核心零部件,特殊的椭圆结构使其在工作中长期承受循环交变应力载荷,极易发生故障。由于运动特性的不同,普通滚动轴承的故障特征频率理论不适用于FTEB,而且FTEB的微弱故障特征在强背景噪声下会被掩盖。因此本文在FTEB的运动学特性分析基础上,研究其微弱故障特征提取及诊断方法。
近年来,以共轭聚合物(或共轭小分子)为代表的有机半导体因为其具有柔性质轻、可溶液大面积印刷加工等优势,引起了广泛的关注,特别是应用于有机/聚合物太阳电池(PSCs)和有机场效应晶体管(OFETs)等光电子器件方向。其中,PSCs作为一种绿色环保的能源器件,在近期也得到了飞速的发展,一步步靠近商业化实际应用。本论文主要研究了共轭聚合物的能级调控策略及共混形貌优化手段,以探索相关研究对光电器件性能的提
由于交通事故、自然灾害、手术创伤和战争等引起不可控制出血造成创伤性死亡已成为全球关切的健康问题,因此开发快速、有效、安全的止血材料成为迫切需求,而具有优良生物相容性和生物降解性能的天然高分子止血材料受到青睐,成为现代止血材料领域的研究前沿和热点。本论文针对目前止血材料的发展趋势,提出了开展定向氧化耦合热挤压3D打印构建氧化淀粉凝胶材料的研究。建立了漆酶-TEMPO体系定向氧化及其调控淀粉吸水性能的
化学镀镍废水中的主要污染物包括镍-有机配体络合物和低价态磷酸盐,其现有的处理策略通常是采用两步法,即高级氧化工艺(advanced oxidation processes,AOPs)结合后续的絮凝沉淀过程实现这些污染物的有效去除。此类技术对化学药品(如氧化剂、絮凝剂和碱等)或能源的消耗量大,且容易诱发二次污染。化学镀镍副产物亚磷酸盐(phosphite,HPO32-)具有还原性、动力学稳定性和难生
随着电动汽车、大规模储能系统和新型用电设备的不断发展,人类社会对电化学储能的需求快速增长,并且也对储能电池设备提出了更高的要求,例如高能量密度、快速充放电、高安全性和低成本等。新型储能体系例如钠离子电池和水系锌离子电池的发展对于满足这些需求有着重要意义。而设计和研究合适的电极材料对于实现高性能钠离子电池和锌离子电池起着至关重要的作用。为了解决这些二次电池的正极材料所面临的问题,我们有针对性地进行了
近年来,由废塑料引起的“白色污染”问题对生态环境和人类健康造成了极大的威胁。开发可生物降解聚合物材料是缓解该问题的有效途径之一。聚乙烯醇(PVA)是一种性能良好的可生物降解聚合物,被应用于各种领域。但是由于PVA分子主链上含有的大量羟基,使得PVA熔融温度与分解温度非常接近,不利于熔融加工,通过化学改性或共混改性可以降低熔点,但通常会造成其力学性能严重下降;此外PVA耐水性差,功能单一,这些缺点极
固体氧化物电池(SOCs)具有化学能-电能转换效率高、燃料多样化、排放污染物少等优势,被认为是一种颇具前景的能源转化装置。然而缺乏高效稳定的电极材料导致SOCs难以实现大规模应用。钙钛矿相氧化物(ABO3)以其结构稳定、组成可调等优势作为电极材料而被广泛应用于SOCs领域。在高温工作条件(>600oC)下,研究者发现钙钛矿表面往往存在阳离子偏析,这极大地改变了电极表面的物理化学性质,进而影响电极的
近年来,湿度测量在众多领域引起广泛关注,其应用范围涉及天气预报、农业生产、工业制造、历史文物保护及可穿戴电子产品等领域。湿度传感器作为检测湿度变化的重要工具,能够将虚拟的湿度信号转化为可读的电信号,已广泛应用于人们的日常生活中。目前,多数商业化湿度传感器以多孔型陶瓷为基材,由于其刚性结构和复杂的制备过程,限制了其在新兴可穿戴电子领域中的进一步应用。基于聚合物基体/导电填料体系构建的湿度传感器表现出