论文部分内容阅读
摘要:人眼作为面部的主要特征,对其形状分类可以为身份识别(如虹膜识别和人脸识别)等应用提供非常重要的信息,而聚类为分类提供依据。本文提出了一种眼睛形状聚类算法,该算法分为以下几大部分:第一部分确定眼睛轮廓,对输入人眼图片进行关键点检测;第二部分根据轮廓点对能够描述人眼形状的相关特征进行提取;最后,通过K-means聚类算法对提取的特征进行聚类。算法共得到7个眼睛形状聚类。
关键词:虹膜识别,关键点检测,特征提取,眼睛形状聚类
1 引言
随着机器视觉、人工智能等领域技术的飞跃,IT行业进入了认知时代[1],虹膜识别、刷脸支付等生物特征识别技术出现在日常生活中。与传统的身份验证方法(身份证件、银行卡、口令等)相比,生物特征有不易复制,不易丢失等显著优点[2]。
眼睛作为具有高度辨识性的面部器官之一,在虹膜识别和人脸识别等领域起着关键的作用。在虹膜识别中,眼睛检测是预处理的第一步,也是至关重要的一步。大型的面部特征数据库能够根据人眼形状划分为多个子面部特征数据库,从而为缩小身份搜寻范围提供极其有效的信息,在此基础上进行人脸识别将会大幅提高识别速度[3-5]。在此背景下,基于关键点的眼睛形状聚类算法实现有着深远的应用前景和研究价值。
2 算法流程
在通过神经网络等方法进行人眼检测后,基于关键点的眼睛形状聚类算法总流程包括轮廓点检测、特征提取与眼形聚类几个主要步骤。人眼轮廓点的位置信息为后续特征提取及眼形聚类提供了数据支持。
2.1确定眼睛轮廓
本文采用AlexNet模型,AlexNet具备5个卷积层和3个全连接层[14]。
(1)卷积层
卷积层共有5层。在后续参数优化过程中,一个卷积核与一个差值相映射,即本卷积层里每个卷积核与上层输入的每个偏差值相映射。
(2)全连接层
全连接层共有3层,上一层输出的特征图与本层全连接,本文采用tf.reshape()将特征图转换为一维尺度,输出值遵循dropout规则[6-13]。
3 实验结果
实验数据集来自剑桥大学Rainbow Group,该数据集包含11382个眼睛特写图像[12]。本算法利用了眼周12个坐标点,左眼角关键点序号为0,其他关键点按照顺时针依次排列,分别记为p0,p1,…,p11。人眼样本及轮廓点如图1所示。
人眼图像共聚成7类,其特征数据如表1所示。根据数据和直观认识,7类眼形分别命名为细长眼、梭形眼、上斜眼、标准眼、杏眼、半月眼、眯缝眼。
4 结论
本文提出一种基于关键点的眼睛形状聚类算法。该算法基于关键点检测技术,提取眼周相关数据,对目标眼形进行聚类。
基于关键点的眼睛形状聚类算法不足之处在于:人眼关键点检测环节,受图片中眼周阴影、睫毛等因素影响,关键点定位精确度不高,影响聚类效果。
本文受北京市教委面上(KM201510009005)等资助。
参考文献
[1]沈晓卫.IT行业已进入认知时代,掌握这5点很关键.[EB/OL].http://www.sohu.com /a/ 133469 919_38932 7,2017.
[2]王涛.基于脸部生物特征及人眼定位的身份识别系统[D].兰州:兰州大学,2010.
[3]孙劲光,荣文钊.曲线相似度眼型分类[J].计算机科学与探索,2017,11(8):1305-1313.
[4]刘欢喜.人体生物特征的综合分析与应用[D].上海:上海交通大学,2010.
[5]RainbowGroup.RenderingofEyes for Eye-Shape Registration andGazeEstimation.[EB/OL].http://www.cl.cam.ac.uk/research/rainbow/projects/syntheseyes/,2015.
[6]賈瑞凤,马曾,侯春龙.以Python为工具培养学生计算思维[J].电脑知识与技术,2018,14(02):117-118.
[7]Tensorflow官方网站.Tensorflow简介.[EB/OL]. https://www.tensorflow.org/,2016.
[8]张立毅.神经网络盲均衡理论、算法与应用[M].北京:清华大学出版社,2013,43-44.
[9]Wikipedia.Convolutional neural network.[EB/OL]. https://en.wikipedia .org /wiki/ Convolutional_ neural_ network,2018.
[10]SVL.Module 2:Convolutional Neural Networks.[EB/OL]. http://cs231n.github.io/ convol- utional-networks/#conv,2018.
[11]ujjwalkarn.An Intuitive Explanation of Convolutional Neural Networks.[EB/OL].https:// ujjwalkarn.me /20 16/08/11/intuitive-explanation-convnets/,2016-8-11.
[12]Fredrik Lundh.An Introduction To Tkinter[EB/OL].http://effbot.org/tkinterbook /tkinter -whats-tkinter.ht - m,1999.
[13]朱威,屈景怡,吴仁彪.结合批归一化的直通卷积神经网络图像分类算法[J].计算机辅助设计与图形学学报,2017,29(9):1650-1657.
[14]Alex Krizhevsky,,Ilya Sutskever,,and Geoffrey E. Hinton. ImageNet Classification with Deep Convo lutional Neural Networks[J].COMMUNICATIONS OF THE ACM,2017,60(6):84-90.
[15]Wikipedia.Cross entropy.[EB/OL]. https://en.wikipedia.org/wiki/Cross_entropy,2018- 1-13.
[16]索红光,王玉伟.一种用于文本聚类的改进k-means算法[J].山东大学学报(理学版),2008,43(1):60-64.
(作者单位:北方工业大学信息学院)
关键词:虹膜识别,关键点检测,特征提取,眼睛形状聚类
1 引言
随着机器视觉、人工智能等领域技术的飞跃,IT行业进入了认知时代[1],虹膜识别、刷脸支付等生物特征识别技术出现在日常生活中。与传统的身份验证方法(身份证件、银行卡、口令等)相比,生物特征有不易复制,不易丢失等显著优点[2]。
眼睛作为具有高度辨识性的面部器官之一,在虹膜识别和人脸识别等领域起着关键的作用。在虹膜识别中,眼睛检测是预处理的第一步,也是至关重要的一步。大型的面部特征数据库能够根据人眼形状划分为多个子面部特征数据库,从而为缩小身份搜寻范围提供极其有效的信息,在此基础上进行人脸识别将会大幅提高识别速度[3-5]。在此背景下,基于关键点的眼睛形状聚类算法实现有着深远的应用前景和研究价值。
2 算法流程
在通过神经网络等方法进行人眼检测后,基于关键点的眼睛形状聚类算法总流程包括轮廓点检测、特征提取与眼形聚类几个主要步骤。人眼轮廓点的位置信息为后续特征提取及眼形聚类提供了数据支持。
2.1确定眼睛轮廓
本文采用AlexNet模型,AlexNet具备5个卷积层和3个全连接层[14]。
(1)卷积层
卷积层共有5层。在后续参数优化过程中,一个卷积核与一个差值相映射,即本卷积层里每个卷积核与上层输入的每个偏差值相映射。
(2)全连接层
全连接层共有3层,上一层输出的特征图与本层全连接,本文采用tf.reshape()将特征图转换为一维尺度,输出值遵循dropout规则[6-13]。
3 实验结果
实验数据集来自剑桥大学Rainbow Group,该数据集包含11382个眼睛特写图像[12]。本算法利用了眼周12个坐标点,左眼角关键点序号为0,其他关键点按照顺时针依次排列,分别记为p0,p1,…,p11。人眼样本及轮廓点如图1所示。
人眼图像共聚成7类,其特征数据如表1所示。根据数据和直观认识,7类眼形分别命名为细长眼、梭形眼、上斜眼、标准眼、杏眼、半月眼、眯缝眼。
4 结论
本文提出一种基于关键点的眼睛形状聚类算法。该算法基于关键点检测技术,提取眼周相关数据,对目标眼形进行聚类。
基于关键点的眼睛形状聚类算法不足之处在于:人眼关键点检测环节,受图片中眼周阴影、睫毛等因素影响,关键点定位精确度不高,影响聚类效果。
本文受北京市教委面上(KM201510009005)等资助。
参考文献
[1]沈晓卫.IT行业已进入认知时代,掌握这5点很关键.[EB/OL].http://www.sohu.com /a/ 133469 919_38932 7,2017.
[2]王涛.基于脸部生物特征及人眼定位的身份识别系统[D].兰州:兰州大学,2010.
[3]孙劲光,荣文钊.曲线相似度眼型分类[J].计算机科学与探索,2017,11(8):1305-1313.
[4]刘欢喜.人体生物特征的综合分析与应用[D].上海:上海交通大学,2010.
[5]RainbowGroup.RenderingofEyes for Eye-Shape Registration andGazeEstimation.[EB/OL].http://www.cl.cam.ac.uk/research/rainbow/projects/syntheseyes/,2015.
[6]賈瑞凤,马曾,侯春龙.以Python为工具培养学生计算思维[J].电脑知识与技术,2018,14(02):117-118.
[7]Tensorflow官方网站.Tensorflow简介.[EB/OL]. https://www.tensorflow.org/,2016.
[8]张立毅.神经网络盲均衡理论、算法与应用[M].北京:清华大学出版社,2013,43-44.
[9]Wikipedia.Convolutional neural network.[EB/OL]. https://en.wikipedia .org /wiki/ Convolutional_ neural_ network,2018.
[10]SVL.Module 2:Convolutional Neural Networks.[EB/OL]. http://cs231n.github.io/ convol- utional-networks/#conv,2018.
[11]ujjwalkarn.An Intuitive Explanation of Convolutional Neural Networks.[EB/OL].https:// ujjwalkarn.me /20 16/08/11/intuitive-explanation-convnets/,2016-8-11.
[12]Fredrik Lundh.An Introduction To Tkinter[EB/OL].http://effbot.org/tkinterbook /tkinter -whats-tkinter.ht - m,1999.
[13]朱威,屈景怡,吴仁彪.结合批归一化的直通卷积神经网络图像分类算法[J].计算机辅助设计与图形学学报,2017,29(9):1650-1657.
[14]Alex Krizhevsky,,Ilya Sutskever,,and Geoffrey E. Hinton. ImageNet Classification with Deep Convo lutional Neural Networks[J].COMMUNICATIONS OF THE ACM,2017,60(6):84-90.
[15]Wikipedia.Cross entropy.[EB/OL]. https://en.wikipedia.org/wiki/Cross_entropy,2018- 1-13.
[16]索红光,王玉伟.一种用于文本聚类的改进k-means算法[J].山东大学学报(理学版),2008,43(1):60-64.
(作者单位:北方工业大学信息学院)