基于运动轨迹和手型特征的手语识别研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wusuowei282736
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是聋哑人日常生活的主要语言,同时也是他们和正常人交流的主要方式之一。而大多数正常人并未经过专业的手语培训,使得聋哑人无法同其进行无障碍地交流。为了解决这个问题,从上世纪90年代开始便有许多学者开始从事手语识别的研究,旨在将手语动作通过计算机编程实现将其转换为便于正常人理解的文本或者语音信息。因此手语识别具有极大的社会意义。在手语识别领域,有两个至关重要的问题。一是如何获取并设计鲁棒高效的手语动作特征,二是如何对手语动作特征建立鲁棒的识别模型。对于第一个问题,从昂贵复杂的数据手套到颜色手套再到体感设备,数据获取越来越方便可行,特征设计主要从运动轨迹和手型变化上进行描述。对于第二个问题,对手语动作进行建模识别主要是借鉴于语音识别,利用机器学习理论中的一些模型。例如利用可以计算不等长序列相关性的动态时间规整算法以及机器学习模型支持向量机、高斯混合模型、隐马尔科夫模型、条件随机场、人工神经网络等等。基于此两个出发点本文的主要工作可归纳如下:首先,手语动作特征包括手语动作的轨迹特征和手型特征。轨迹特征包括运动的方向,运动轨迹的形状,以及运动轨迹的位置。手语动作的运动方向利用方向位移直方图刻画,将空间分成多个二维平面考虑手部在平面中各个方向的位移量,组合所有方向的直方图最终对方向信息进行表达。运动轨迹的形状本文提出采样形状上下文描述子进行刻画,在提取轨迹特征的形状上下文信息时需要对轨迹进行预处理,即基于密度的上采样处理,使得轨迹形状看起来更加的均匀平滑,最后再对每一个采样点进行形状上下文描述子的提取。对于轨迹的位置信息,本文采用非手骨骼点相对于手部骨骼点的位置进行刻画。在手型描述中,经过对视频信息的预处理,获取以手部骨骼点为中心的局部区域,区域中包含了手型,再对其提取HOG特征,最终将手语序列的手型特征利用HOG特征序列描述。其次,我们提出的自动确定隐状态数目的FHMM模型可以根据手语动作本身特性自动确定建模所需参数。我们利用手型之间的特征差异将视频中的手分成若干段,其中相似的手型归为同一段。由于在特征描述中的不同,不同的特征适用于不同的识别模型,因此还需要对多个特征的识别结果进行融合。本文提出了两种融合方法,一种为基于帧平均概率的计算方法,另一种为对输出概率进行重新建模分析的方法。实验证明基于可变隐状态数目的模型具有较好的识别结果,结合适当的结果融合方法也能一定程度提高手语识别正确率。此外,我们将部分算法整合到系统当中,搭建了实时手语识别演示系统。并对我们的数据采集系统和演示系统进行了简要的介绍。
其他文献
随着计算机科学和芯片制造工艺的飞速发展,数据采集、处理和传输这三大信息技术相互促进,推动数字系统向着大容量、小体积、高速度的方向发展。FPGA凭借其灵活性、适应性和可重
立体图像技术是图像领域内重要的研究方向之一,立体图像技术在科学技术研究、军事、教育、医疗等诸多领域有着广阔的应用前景。使用立体摄像机或者深度摄像机,可以还原场景的
IC晶片图像检测包括特征尺寸测量、缺陷检测(DI)以及目检(VI),依靠人眼加放大镜的检测方式受到很大挑战且存在很多不足之处,已经不能满足现代工业生产要求。本文针对IC晶片图
轴类零件尺寸的测量是轴类零件制造业的重要环节,随着制造技术的不断发展,传统的测量方法已经不能满足生产的需要。就目前国内许多制造业对零件的尺寸检测而言,其检测工作还
弹上信息传输是地面与高速运动目标进行通信的系统,对保密抗干扰、通信的实时性、通信的质量有着严格要求,并存在严重的多普勒调制,广泛用于航天、航空、导弹等领域。本文根
宽带数字接收机是高精度宽带雷达接收系统的重要部分。本文针对宽带雷达信号的诸多优点,利用软件无线电中信道化接收的概念,实现全波段的宽带数字接收机,为宽带信号数字化技术发
本文是对基于无人机图像传输的π/4-DQPSK的全数字调制解调技术的研究,利用π/4-DQPSK数字调制和基带差分解调技术实现数字信号的传输。π/4-DQPSK是QPSK改进方式,它是一种线
本文介绍了国内外扭振检测技术的发展与现状,在此基础上分析了一种用软件实现轴系扭振检测的方法,该方法是基于希尔伯特变换解调原理。扭振检测模块的设计以DSP处理器为核心,
随着网络技术的不断发展,越来越多的人们希望通过网络寻找到他们感兴趣的东西,如音乐、图片等。人们的这种需求对多媒体检索提出了新的要求。音乐检索是继图像检索之后在基于
由于毫米波具有较好的穿透性,利用被动毫米波成像技术对隐藏在衣物下的危险物品(枪支、刀具、炸药等)进行识别、定位成为安检领域的又一研究热点。但是目前毫米波图像存在着