复杂背景下人脸检测与仿生模式人脸识别的神经网络方法研究

来源 :中国科学院半导体研究所 | 被引量 : 0次 | 上传用户:mars1998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文首先就人脸检测与人脸识别领域的研究现状进行了综合论述,对各种方法的理论依据和实现方式做了较详细的介绍,并指出了当前人脸检测与人脸识别领域的研究重点与难点,为我们的进一步的研究工作明确了方向.论文研究了如何只利用图像的灰度信息,对处于复杂背景下的多姿态人脸进行快速、有效的检测问题.由于背景的复杂性、人脸模式的多态性,使得对该问题的解决具有一定的难度,从而使其成为该论文的研究重点.我们在对眼睛部件的灰度特性进行深入分析的基础上,提出了一种自下而上,由粗到细的人脸检测算法.其通过对图像进行预处理(似眼物检测),不但缩小了人脸检测的搜索空间,而且将复杂背景下多姿态多人脸检测问题,简化为在候选区域内、已知大致的人脸尺度情况下的正面端正单人脸检测问题,并结合多模板匹配与规则验证完成人脸区域的最后确定.实验表明该方法是行之有效的.论文研究了在彩色图像中,如何利用肤色信息完成对人脸进行快速的检测问题.我们提出了一种建立在对归一化RGB颜色空间的r-g平面和YIQ颜色空间的Q-I平面上肤色区域的矩形和三角形近似基础上的,利用经验阈值进行快速肤色检测的方法,并给出了该方法和基于灰度信息的人脸检测方法相结合的彩色图像快速人脸检测算法.实验表明,与单纯的利用灰度信息的人脸检测方法相比,基于肤色信息的人脸检测方法具有较快的检测速度、较高的检测成功率与较低的虚警率.论文的最后对我们实现的基于仿生模式识别的人脸识别、人脸确认系统进行了较为详细的介绍,并将人脸识别的效果同最近邻法、不同核函数的SVM进行了分析对比.以ORL人脸库为识别对象,针对有"拒识"的情况下,通过改变不同识别算法的可调参数,在保证参与训练人的正确识别率在大致相同水平的条件下,分析了参与训练人的错误识别率(错识别为参与训练的其他人)与未参与训练人的错误接受率(错识别为参与训练的某人)的优劣.实验结果表明,基于仿生模式识别的方法具有较高的安全性,明显优于其它模式识别方法,具有一定的实际应用价值.
其他文献
近年来的研究表明,飞行器上的天线在某些视角范围内产生很强的雷达散射截面贡献,因此分析天线的雷达散射截面对飞行器隐身技术的发展具有重要的意义.该文主要是对喇叭天线的
本文通过对荣华二采区10
期刊
该论文总结了半导体激光器稳恒控制的概念,稳恒控制包括恒电流控制,恒功率控制和恒温度控制.恒电流控制通过负反馈回路为半导体激光器提供恒定的注入电流;恒功率控制利用光电
在ATP和Zn2+存在的情况下,吡哆醛激酶(PDXK)能够催化吡哆醛、吡哆胺和吡哆醇的磷酸化,这是生成吡哆醛-5’-磷酸(PLP)的关键步骤。PLP是维生素B6的活性辅酶形式,可以作为140多种
[1月]冬季盆栽植株摆放在阳光充足的阳台或窗台,室温保持在10℃以上,每周浇水1次,水温要求与室温接近。如果盆土过湿,植株易枯萎死亡。[2月]植株摆放位置不变,但要防止穿堂风
楚文化是以江汉地区为中心,在原始巫术、宗教、神话中发展起来的,带有浓郁地域色彩,开放而浪漫的文化。从楚文物和楚文学中体现出来的美学思想,是一种柔中带刚、绚丽俊秀的南国美学。楚人按照自己的审美情趣,演绎出其放眼天下、有容乃大的艺术特征,分析楚文化视觉语言的美学思想,可从巫术和骚学呈现的视觉元素进行探讨。
该论文针对在电话线等窄带信道上进行数字语音传输及大容量语音数据存储和回放的应用,开发了一种比特率为2.4kb/s的低码率声码器系统,在算法级对压缩编、解码器的各模块进行
实现视频图像压缩和解压缩的超大规模集成电路(VLSI)芯片设计已经成为多媒体核心技术之一.该文研究了国际运动图像专家组制定的MPEG-1,MPEG-2,MPEG-4标准和美国DivX Networks
贵金属(金、银)纳米结构的局域表面等离激元(LSP)近场增强特性是提高半导体器件发光效率的重要途径之一。本论文围绕有序排列、尺寸可控纳米银结构阵列的LSP对硅基半导体薄膜a-SiN_x:O材料发光效率的增强研究,对不同尺寸纳米银六角阵列在a-SiN_x:O介质中的LSP共振特性进行仿真,分析了纳米银六角阵列中纳米银尺寸和间距对实现LSP与有源层a-SiN_x:O共振耦合的影响,获得了蓝光最佳耦合状
CPI是社会各方关注的热点问题。本文通过对CPI编制目标与理论、范围、商品分类、权重、汇编模型、产品质量与季节性产品调整、住房处理等问题比较分析,坦陈CPI编制需要完善的