基于认知逻辑的个性化人脸图像合成研究

被引量 : 6次 | 上传用户:zhanghao2018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化人脸图像合成在公安刑侦、影视制作、娱乐、教育等领域有着十分广泛的应用,受到不少研究者的关注。但以往对个性化人脸图像合成的研究仅仅局限于计算机领域的专家和研究者中,甚少有跨领域的合作研究,而人脸具有非刚性、类间相似性和易受干扰等特点,从纯计算机技术角度来解决个性化人脸图像合成问题是相当困难的,目前对个性化人脸图像合成的研究尚处于初级阶段,成熟的应用很少。认知科学的出现为计算机、哲学、心理学等学科的融合提供了一个平台,也为解决个性化人脸图像合成问题提供了一些新的方向。如何将认知等主观的内容融合进计算机系统的设计,如何使用哲学的思辨思想来改进计算机程序,这在未来的相当长一段时间内都将是一个值得深入研究的课题。本文从个性化人脸图像合成这个应用入手,尝试使用认知逻辑来指引计算机系统的设计,将认知逻辑的思想贯穿在程序设计之中,从而跳出目前个性化人脸图像合成研究的困境。本文在对个性化人脸图像合成涉及到的各个环节进行认知的考量的基础上,提出了一种基于认知逻辑的个性化人脸图像合成方法,实现了不同年龄段中不同胖瘦、不同生活水平下的个性化人脸图像的定制。在对人识别人脸光照的过程和人识别不同年龄人脸的过程进行形式化的基础上,设计出对称区块光照补偿算法和基于年龄的灰度调整算法;在对主动形状模型算法的不足进行认知分析的基础上对该算法进行了改进;在对基于特征线对的图像变形算法的缺点进行认知逻辑角度的分析之后,提出对特征线对选取的改进意见,并对算法中的三个参数进行了认知角度的诠释,使其更易被人接受;在对基于多分辨率分析的图像合成算法的不足进行认知分析的基础上,提出改进算法,并增加发型替换部分;在系统的设计中,把“人机结合,以人为主”的思想贯彻在设计中,通过人机交互的方式融合了专家智慧和机器智能,以专家的信念来修正机器的信念,从而构建人机协同工作的环境。实验结果表明,该方法能有效进行个性化人脸图像合成,结果比较逼真,不同定制条件下的合成图像具有较大的区分度。本文的主要工作和创新点如下:1、在对现有的光照归一化方法从认知的角度进行分析的基础上,提出了基于对称区块的人脸光照补偿算法和基于年龄的灰度调整算法,完善了人脸图像的灰度归一化方法。现有的光照补偿算法主要是从图像整体出发来开展研究,这种以图像整体的光照为基础的方法与人类的认知规律不相吻合。为了更好地开展人脸图像的预处理,在对人脸图像灰度归一化方法进行认知思考的基础上,根据人认知人脸的普遍规律,对人认知人脸光照的过程进行了形式化,之后使用对称区块的背景光对光照较暗一侧的对称区域进行光照补偿,取得了较好的实际效果。此外,通过对不同年龄段人脸的肤色特征进行研究,总结出了不同年龄段人脸的肤色变化规律,并在形式化的基础上将之用于灰度调整算法的设计,调整之后的人脸图像在肤色方面具备一定的年龄特征,为后续的程序提供了良好的基础数据。2、对目前广泛使用的人脸特征点提取方法进行了梳理,从认知逻辑的角度对最常使用的ASM算法进行了重新审视,分析了ASM算法的不足及其内在的原因,并对ASM算法进行了改进。目前人脸特征点定位主要使用基于几何特征、统计特征、频率域特征以及多种特征融合的特征提取技术,而ASM算法是目前广泛使用的特征点定位的经典算法之一,具有比较好的精确性和鲁棒性。但由于ASM算法对于初始状态十分敏感,并且搜索是以全局收缩为结束条件。为了解决这个问题,根据人认知人脸的规律,引入了特征点定位微调机制,使用专家智慧对ASM算法的定位结果进行最后确认,从而在一定程度上修正ASM算法的偏差。同时为了更符合个性化人脸图像合成的要求,在FG-NET数据库原有68个特征点的基础上,增加表征发型和发际线的22个特征点,使样本图像的特征点更符合实际应用的需要。3、介绍了目前主流的图像变形技术,并对其优缺点进行分析和对比,针对个性化人脸图像合成这个具体应用,采用了基于特征线对的图像变形技术,在对该技术从认知逻辑的角度进行考虑的基础上,对基于特征线对的人脸轮廓变形算法进行了改进。基于特征线对的图像变形算法其核心在于特征线对的设置,选取的特征线对的好坏决定了变形的效果,针对人脸图像的特点和人的认知特点,提出了非均匀特征线对选取方法,将特征线对向眼睛、嘴唇等重点部位倾斜,从而改进了基于特征线对的图像变形算法的效果。对该算法中关键的三个参数从认知的角度进行了分析,对其取值的认知意义进行了明确,并进行了实验验证。4、介绍了小波变换的基础知识,并对基于多分辨率分析的图像合成的不足进行了认知逻辑上的分析,在此基础上提出了基于认知逻辑的人脸年龄特征合成方法。针对直接替换重构方法中年龄特征不明显的问题,提出将样本图像的低频部分经过巴特沃斯高通滤波之后叠加到测试图像的低频部分的方法,提升了年龄特征移植的效果。针对发型和发际线会对人脸年龄观感产生很大影响这一现象,设计了发型替换算法,将样本图像的发型和额头部分直接替换到测试图像上,极大提升了合成图像的逼真程度。5、将“人机结合,以人为主”的思想融入到系统的设计中,使用专家的信念对计算机的计算结果,即计算机的“信念”进行修正,从而对计算机的计算结果进行干预,开发出人机结合的个性化人脸图像合成系统。在设计中,通过专家与计算机的协同,将专家的智慧与计算机速度快、容量大的特点有机地结合起来,发挥出他们各自的优势,将计算机从不擅长的形象思维中解放出来,将其定位为一个“超级秘书”,辅助专家进行工作。使用专家信念对ASM算法定位不精确、年龄估计偏差大的问题进行修正,同时通过专家评估来确定程序是否结束,这些人机交互环节的引入使得系统效率更高、效果更好。最后,对论文进行了总结,就设计中存在的三个方面的问题进行了分析,并提出了未来进一步研究的方向。
其他文献
<正>在浙江嘉兴碧波荡漾的南湖水面上,停泊着一艘美丽的画舫,它就是被称为南湖红船的中共一大会议纪念船。1921年,中共一大最后一天的会议由于上海法租界巡捕的骚扰而被迫转
上海三枪(集团)有限公司是一家以生产、销售针织内衣及服饰为主的国有企业,是上海龙头股份有限公司的重要组成部分。上海三枪(集团)有限公司的营销网络遍布全国各主要省市,目
软土由于具有含水量高、压缩性大、抗剪强度低等特点,使得在其上修建建筑物时承载力往往得不到满足。对此,可从结构自身出发,充分利用土体与结构物的相互作用,进而达到改善整
为了探讨不同品种兰花的生长差异,筛选出在乌鲁木齐适应生长的兰花品种,总结兰花在乌鲁木齐的温室栽培技术。本文主要对引进的寒兰、春兰和风兰三种兰花的栽培技术,不同温度对三
城市公交是政府为人民出行方便提供的一种基础服务设施,它具有公益性的特点。但是随着经济的发展城市人口的增多,城市交通状况堪忧,拥堵情况严重,反而为人们的出行造成了不利
曹禹先生名作《雷雨》中,交织着爱恨情仇人伦悲剧,蕴藏着错综复杂的矛盾。正因为矛盾冲突太多,其中有不少未解之谜。这些谜团中,有些是曹禺先生故意"布疑",有的是创作时顾此
中小医药企业是我国医药行业的重要组成部分,其发展对医药行业的发展起着不可忽视的支撑和促进作用。GMP改造后,我国中小医药企业在积累和规模上有所改善,但是由于诸多原因,
经过初筛、复筛,得到2株菊粉酶活力较高的酵母菌Y9和Y27,其发酵液酶活分别达到19.4U/mL和14.1U/mL,两者胞外菊粉酶分泌较少,主要分布在酵母菌菌体上。通过细胞形态、生理生化特征及B
随着车辆设计的方向朝着高速化、轻量化的方向发展,汽车保有量持续增加,交通事故数量及其造成的人员伤亡数量呈上升趋势。汽车被动安全技术的研究与发展已经成为当今世界汽车
二郎神,系道教及民间信仰中的重要神灵之一,在历史上为汉族地区所广泛信仰与崇拜。以藏传佛教与苯教为主体信仰的安多藏区中,有部分地区也流行着二郎神信仰,具有其庙宇建筑、