图像特征识别算法及其在聋人视觉识别中的应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:kdkd03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和信息技术的飞速发展,3G生活已经走进了千家万户,4G技术也已经开始崭露头角,这些高新技术的出现,使人们的工作和生活产生了史无前例的巨大变化。借助这些高新技术,人们的工作更加快捷,生活也更为便利,同时,对一直存在于我们身边的弱势群体——聋哑人群体也更加地关注。中国现有聋哑人2000多万,为了使这2000多万聋哑人更好更快地融入到正常社会生活之中,消除健全人与聋哑人之间交流的障碍,提高他们的生活质量,真正地实现融合共生,构建社会和谐,聋人视觉识别研究已受到国内越来越多的专家和学者关注。在现有的各种聋人视觉识别算法中,处于主导地位的主要是基于数据手套的聋人视觉识别和基于数字图像处理的聋人视觉识别方法。大部分研究是将两种算法相结合,前者主要用于图像的采集,而用后者进行图像的识别和处理,以便取得更好的识别效果。尽管聋人视觉识别已经取得某些进展,但仍然面临如手势不变特征的提取、手势之间的过渡模型等许多挑战性课题,导致目前的手语识别算法在识别率,健壮性等方面存在诸多不足。本文对上述问题进行了研究,并取得了阶段性的研究成果,且将其应用于作者承担开发的聋哑人视觉识别交流系统的应用软件研制,部分地已投入了实际教学试用。尽管该应用软件还存在许多有待改进完善之处,但仍然取得了良好的应用效果,并受到从事相关工作单位的肯定。从事研究期间的主要工作和创新性集中地归纳为以下几个方面:①针对分水岭算法对噪声十分敏感,容易引起边缘不连续,伪边缘、过分割等现象,提出一种基于形态学和分水岭算法相结合的图像几何特征辨识算法。该算法借助前者获取将图像的前景色和背景色最大程序分开的最佳阈值,再利用该阈值对后者的路径代价函数进行限制,从而缩小查找范围,提高了算法的执行速度。②针对目前各种融合算法在图像识别中存在的光谱特性扭曲、算法复杂度高,内存需求量大,难以兼顾图像的整体结构和细节等问题,提出一种基于双正交小波变换纹理一致性测度融合算法。该算法根据正交小波变换对于融合的源图像分别进行小波分解,其低频系数按比例选取图像的小波系数构成融合图像小波低频系数矩阵,高频系数采用纹理一致性测度分析特定区域不同高低频系数的边缘特性,并以一定规则确定融合图像高频小波系数矩阵。实验结果表明,该融合算法既可较好地分辨出伪边缘,使细节信息更加丰富和真实,又兼顾了整体视觉效果,具有较好的识别效果。③针对手形识别的局限性,提出一种基于模糊BP神经网络的手语融合识别算法。该算法借助模糊BP神经网络,将采集的手形和唇形图像进行融合计算,其融合图像被分别视为手形和唇形模糊集,对模糊集进行模糊算子操作,将操作结果与数据库手语符号进行匹配,然后将获取的两个手语集再进行模糊集合运算,最后得到识别结果。实验表明了该算法的有效性。④针对在复杂光照条件下,传统人脸特征识别算法往往忽略了局部区域像间的对比度,丢弃了部分重要的纹理特征信息,导致识别效果不理想,提出一种改进的LBP人脸特征识别算法。该算法先对不同复杂光照下的人脸图像进行光照归一化预处理,将光照变化控制在一定范围之内,再借助改进的LBP算法将局部区域像素间的对比度值映射为一个区间值,使光照变化引起的对比度值在控制区间内波动,从而使图像具有光照不变性,使之可较好地识别出人脸特征。
其他文献
黑洞一直被认为是星体命运的终点。当星体耗完最后一丝能量的时候.要么被撕裂,然后被别的星球“吞食”.要么浓缩成一个可怕的黑点经过它的一切物质和能量。
目的探讨腹腔镜联合胃镜单孔腹腔镜手术治疗胃间质瘤的临床价值和效果。方法采用经脐单孔免气腹,腹腔镜联合胃镜定位,从腹腔切除胃问质瘤,腹腔镜胃部分切除治疗5例胃前壁,1例胃后
为研究方钢管混凝土轴压短柱力学性能,采用试验和ABAQUS有限元模拟分析相结合的方法,得到方钢管混凝土短柱实用承载力计算公式.对3根方钢管混凝土轴压短柱试件进行试验研究,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
城市河道的规划设计是随着社会、经济的发展而不断完善和发展的,一成不变的设计不符合科学合理的规划设计理念。通过介绍国内外城市河道的发展进程,针对我国城市河道存在的水
通过实验探究钠究竟能否置换硫酸铜溶液中的铜.结果显示:当把钠块用锡箔纸包住完全置于CuSO4溶液中,随着CuSO4溶液浓度、温度升高,反应剧烈程度也随之增大,产物中都有蓝色物
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
眼睛是人类最主要的感觉器官,相对于嘴、鼻子,人脸面部区域中眼睛具有显著特征。研究眼睛及其运动是了解人类视觉信息的重要手段。本文针对人眼视觉信息检测的关键技术,研究
苏州市吴江区创建现代网格化精准社会治理模式。包括"241"总体框架、"721"工作目标、"六个一"工作机制以及"两纵四横"组织结构体系、"智慧大脑"空间感知体系、"集成联动"服务
本文将控制理论的能观度概念运用到姿态估计的精度分析,建立了能观度和精度之间的解析关系,指出能观度可作为比较量测模型优劣的数字特征,解决了量测模型的选择问题。此外,本