基于多模态输入的手势识别算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:fengliufeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为新一波科技浪潮的排头兵,人工智能正以前所未有的速度渗透到人类生活的方方面面。其中,人机交互技术作为人工智能领域的重要组成部分,受到广泛的关注。在众多的人机交互手段中,手势交互是最接近人类交流习惯也是最自然的一种交互方式,相关手势识别技术可以被用于聋哑人教学、智能家居和虚拟现实等应用场合,具有广泛的应用前景。在上述背景下,本文对基于视觉的静态及动态手势识别问题进行了重点研究,取得了一些富有实际意义的研究成果。本文的主要工作与创新点如下:1.深入研究了静态手势识别问题。针对传统的手势检测方法不能对前臂、手掌和手指区域进行很好的区分,导致手势识别效果低下的问题,提出了一种有效的、基于直线检测的冗余手臂去除方法。实验结果验证了方法的有效性。2.现有的静态手势识别算法大都首先利用形状分解方法提取手指特征,然后利用模板匹配技术实现对手势的分类。因此,手指检测算法性能的好坏会对整个系统的识别性能产生直接影响。为此,本文从以下三个方面对手指检测与识别算法进行了改进:(1)提出了一种新的融合形态学处理和曲率信息的手指区域分割算法:(2)提出了一种基于多参数的改进相似性度量方法;(3)提出了一种基于分层模板匹配的手势识别方法。实验结果表明,本文所提出的手势检测与识别方法能有效克服杂乱背景、类肤色区域等不利因素的影响,取得较为理想的检测与识别效果。3.提出了一种基于多卷积神经网络融合的动态手势识别方法。该方法从给定的深度图像序列出发,首先提取运动信息,然后将其送入到不同结构的卷积神经网络以预测相关的三维时序信息,据此可以从空间和时间的维度去捕捉连续运动特征,进而实现对动态手势的分类。定性和定量的实验结果验证了本文所提出的动态手势识别算法的性能。
其他文献
涡街流量计由于无机械可动部件,安装方便,量程比较宽,并且可以测量气体和液体介质等优点,被广泛应用于石油化工等领域。但是,涡街流量计在实际应用中,由于目前普遍使用应力式涡街流量计,容易受到管道强振动干扰容易对测量精度造成的较大影响,特别当振动信号能量大于涡街信号能量时,功率谱分析的方法无法正确得出涡街频率。因此,抗强振动干扰问题是涡街流量计亟需解决的问题,本文基于单传感器抗强振动干扰问题进行了算法和
随着基于P2P的流媒体视频点播(P2P-VOD)系统的日益流行,许多工作都致力于研究如何提高该类系统的性能,以使得系统能更好地支持VCR操作。本文针对P2P-VOD系统,以提高系统性能为目
随着计算机技术、互联网技术的快速发展,数字图像库越来越庞大,传统的基于文本的图像检索方法已经不能满足人们的需求。基于内容的图像检索技术进入人们的视线并迅速成为当前的
猫从高处坠落能安全落地的能力一直被研究者们关注。当一只猫从高空跌落时,它总能通过姿态调整使四肢朝下,加上腿部具有减少地面冲击作用,最终能实现安全落地。机器人在未知
随机系统是一类状态演化表现为随机过程的动态系统,它广泛地存在于实际的工程应用中。相较于一般的确定性系统,其稳定性分析、控制器设计、滤波等问题都更为复杂。本文特别关注
随着能源消耗日益增长、环境污染日渐严重,迫使人们考虑新能源和可再生能源的开发和利用问题。风能已经发展成为世界各国普遍关注的新能源,由此风力发电技术的研究和应用在这几年中突飞猛进,而矢量控制技术在风力发电中具有关键性作用。本文分析了双馈风力发电机的基本工作原理和数学模型,木文介绍了双馈发电机两电平电压型双PWM变流器工作原理、拓扑结构,建立了其基于开关函数的数学模型,并依照功率恒定原则进行三相静止坐
关键词抽取是自然语言处理领域中重要的基础技术,被广泛应用于信息检索、文本聚类、文本分类等方面。目前,互联网中的资讯规模急速增长,包含了大量富有价值的数据,关键词是检索及
随着下一代测序技术的不断发展和逐渐成熟,高通量测序已经成为生物、医学研究中的常规工具,也即将在农业和医疗等行业中得到广泛应用,促生了精准医疗和分子育种等新兴产业。
声反馈是日常生活中的一种常见现象。在扩声系统中,由于同时使用了扬声器和麦克风,普遍存在声反馈现象。当把扩声系统的音量进行较大的提升时,扬声器往往伴有啸叫声出现。这
圆网印花机印花精度和印花质量的高低很大程度上受进布、印花、烘房、落布各单元直流电机同步的影响,因而直流电机的同步调速性能便成为了印花系统中的关键问题之一。传统的转