人脸五官图像分割与清晰度匹配方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:wangguoqiang123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习理论的不断成熟和深度学习技术的迅猛发展,人脸五官图像分割任务近年来得到了相关研究人员的普遍关注。五官图像分割技术可以实现对人脸的细粒度解析,在人脸表情识别、人脸编辑和美容模拟等诸多领域有广泛的应用空间。然而在实际应用时,人脸五官图像分割技术尚存有不足之处。比如,目前主流的人脸五官分割技术采用的是深度学习多网络融合模型,虽然可以获得高精确度的分割效果,但其庞大的网络结构往往需要昂贵的设备支持和较大的时间代价,限制了方法的实际应用。此外,在后续的人脸五官图像拼接应用中,图像之间的清晰度不一致问题,也会严重影响模拟效果。针对上述问题,论文主要研究工作如下:(1)基于人脸关键点定位算法提出一种五官粗定位方法。首先对常见的人脸关键点检测方法进行对比分析,选择级联回归树算法进行实现,并用海伦人脸数据集进行训练,完成对人脸图像的194个特征点进行估计。该方法拥有较低的时间损耗和较高的鲁棒性。进一步地,根据人脸关键点的相对关系提出一种五官粗定位方法,并通过实验确定合适的参数。(2)基于U-Net全卷积网络提高五官分割精度,并通过轻量化网络结构,进一步提升网络计算性能。对于定位不够准确的眉毛和嘴巴部分,在人脸五官粗定位算法的基础上,对常见的全卷积网络进行对比分析,选择U-Net全卷积网络,针对眉毛和嘴巴部分图像分别进行训练并实现精确度更高的分割效果。进一步地,根据特征和图像的尺寸,对网络结构进行轻量化,在确保分割精度的前提下进一步提升计算性能。(3)提出了一种图像间清晰度匹配方法。首先实现4种常见的无参考图像清晰度评价方法,作为对清晰度的多角度定量评价工具,然后实现16种参数不同的模糊算法作为清晰度的多尺度调整工具。为了根据两图之间的清晰度关系选择较合适的模糊算法对图像进行调整,从而使清晰度差值最小化,引入随机森林分类模型作为清晰度匹配的核心选择器。最后,为了补全五官拼接的应用,对泊松融合算法进行了研究和实验。
其他文献
目的:探讨不同病程及不同病情的阻塞性睡眠呼吸暂停低通气综合征(obstructive sleep apnea-hypopnea Syndrome ,OSAHS)对心血管结构和功能的影响。方法:因打鼾而就诊的患者,
知青文学在纷纷扰扰的当代文坛中,可以说并不是一个热点,但却是一个文学重镇。它是以整整一代人戏剧性的遭遇为母题,来展现“文革”那个荒谬的时代中的个体命运。总体来说,知青文
贸易引力模型是对国际贸易进行实证分析的重要方法。本文以传统引力模型为基础,并结合中国与东盟国家的实际情况建立模型,定量分析中国与东盟10国农产品贸易的状况。通过对模
本论文系统考察了史量才办报理念及其对中国报业现代化所作出的贡献,分为三个部分:引言,主体,结语。引言部分简单回顾史量才时期《申报》的成功,说明研究史量才时期的《申报
公平和效率是我国社会主义社会两个最基本的价值取向,同时也是各国公共政策面临的两难选择。20世纪70年代后越来越高的教育民主化思潮呼吁高等教育不断扩大规模以满足更多人
对外壁含有半椭圆裂纹压力容器在单调递增裂纹缺陷尺寸下进行有限元计算,得到了压力容器在不同裂纹缺陷尺寸大小下的裂纹前缘应力、应力强度因子、应力循环次数的演变规律。
近年来,随着我国经济的快速发展,产业结构和社会生产方式发生着巨大的变化。在此背景下,开始了对工业遗产再利用全新的尝试,即用文化创意策略找回工业遗产的空间价值和精神价值。
方言是民族语言的地方分支,是局部地区的人们使用的语言。中国幅员辽阔,有七大方言区。本文试图对宜宾珙县方言进行本字的考释,希望能够看到这些字在方言中的发展以及使用情
高等教育担负着为构建和谐社会提供理论、智力、科研支持的重任,尤其是要为和谐社会的建设提供优秀的人才。本论文从和谐校园内涵和基本要求的研究着手,论述和谐校园的影响因
从欧美率先进入知识经济社会以来,21世纪全球将全面进入知识经济时代,这是世界经济、社会发展的主流。如果说,中国错过了工业革命最佳时机,那么,面临新的经济、社会发展机遇,