论文部分内容阅读
随着计算机技术和信息技术的飞速发展,3G生活已经走进了千家万户,4G技术也已经开始崭露头角,这些高新技术的出现,使人们的工作和生活产生了史无前例的巨大变化。借助这些高新技术,人们的工作更加快捷,生活也更为便利,同时,对一直存在于我们身边的弱势群体——聋哑人群体也更加地关注。中国现有聋哑人2000多万,为了使这2000多万聋哑人更好更快地融入到正常社会生活之中,消除健全人与聋哑人之间交流的障碍,提高他们的生活质量,真正地实现融合共生,构建社会和谐,聋人视觉识别研究已受到国内越来越多的专家和学者关注。在现有的各种聋人视觉识别算法中,处于主导地位的主要是基于数据手套的聋人视觉识别和基于数字图像处理的聋人视觉识别方法。大部分研究是将两种算法相结合,前者主要用于图像的采集,而用后者进行图像的识别和处理,以便取得更好的识别效果。尽管聋人视觉识别已经取得某些进展,但仍然面临如手势不变特征的提取、手势之间的过渡模型等许多挑战性课题,导致目前的手语识别算法在识别率,健壮性等方面存在诸多不足。本文对上述问题进行了研究,并取得了阶段性的研究成果,且将其应用于作者承担开发的聋哑人视觉识别交流系统的应用软件研制,部分地已投入了实际教学试用。尽管该应用软件还存在许多有待改进完善之处,但仍然取得了良好的应用效果,并受到从事相关工作单位的肯定。从事研究期间的主要工作和创新性集中地归纳为以下几个方面:①针对分水岭算法对噪声十分敏感,容易引起边缘不连续,伪边缘、过分割等现象,提出一种基于形态学和分水岭算法相结合的图像几何特征辨识算法。该算法借助前者获取将图像的前景色和背景色最大程序分开的最佳阈值,再利用该阈值对后者的路径代价函数进行限制,从而缩小查找范围,提高了算法的执行速度。②针对目前各种融合算法在图像识别中存在的光谱特性扭曲、算法复杂度高,内存需求量大,难以兼顾图像的整体结构和细节等问题,提出一种基于双正交小波变换纹理一致性测度融合算法。该算法根据正交小波变换对于融合的源图像分别进行小波分解,其低频系数按比例选取图像的小波系数构成融合图像小波低频系数矩阵,高频系数采用纹理一致性测度分析特定区域不同高低频系数的边缘特性,并以一定规则确定融合图像高频小波系数矩阵。实验结果表明,该融合算法既可较好地分辨出伪边缘,使细节信息更加丰富和真实,又兼顾了整体视觉效果,具有较好的识别效果。③针对手形识别的局限性,提出一种基于模糊BP神经网络的手语融合识别算法。该算法借助模糊BP神经网络,将采集的手形和唇形图像进行融合计算,其融合图像被分别视为手形和唇形模糊集,对模糊集进行模糊算子操作,将操作结果与数据库手语符号进行匹配,然后将获取的两个手语集再进行模糊集合运算,最后得到识别结果。实验表明了该算法的有效性。④针对在复杂光照条件下,传统人脸特征识别算法往往忽略了局部区域像间的对比度,丢弃了部分重要的纹理特征信息,导致识别效果不理想,提出一种改进的LBP人脸特征识别算法。该算法先对不同复杂光照下的人脸图像进行光照归一化预处理,将光照变化控制在一定范围之内,再借助改进的LBP算法将局部区域像素间的对比度值映射为一个区间值,使光照变化引起的对比度值在控制区间内波动,从而使图像具有光照不变性,使之可较好地识别出人脸特征。