论文部分内容阅读
[摘 要]21世纪模式识别作为一门新兴学科正在飞速发展,与之相联系的学科也越来越多,如人工智能、计算机科学等。模式识别代替人类进行识别工作提高了工作效率和准确度,因此其应用领域也十分广泛。例如,一些安保系统中,应用指纹识别开门解锁;停车场的智能收费系统中,运用车牌识别技术识别车牌号码;日常聊天中,使用语音识别输入文字等等。本文首先對模式识别的概念及其相关系统进行概述,重点介绍了模式识别技术中的人脸识别技术和语音识别技术,并对模式识别的发展现状进行了分析。
[关键词]模式识别;语音识别技术;人脸识别技术;发展现状
中图分类号:C61 文献标识码:A 文章编号:1009-914X(2018)46-0087-02
1.模式识别的基本概念
在日常生活中,人们经常需要根据事物相似的特征将其进行分类,再通过区分空间或时间中的同类事物中的不同,以获得对世界的认知,这是人们在无意识中进行的模式识别。模式是指人们对所看所闻的事物或现象的分类,比如电器、文具、建筑等;而模式识别即指识别分类中的样本,比如电脑、铅笔、云顶大厦等。模式识别的研究主要分为两大类:第一类是研究人类如何感知对象,第二类是研究计算机如何使用识别的理论和和方法进行工作。而识别又可再分为识别具体事物和识别抽象事物:识别具体事物主要是识别空间信息和时间信息两种,如人脸、虹膜、气象图等为空间信息,波形、信号等为时间信息;识别抽象事物是指对某个问题的解决方案的识别或对人类情绪的识别等[1]。
2.模式识别系统
模式识别的系统主要分为四个部分:数据获取,数据处理,特征提取和分类决策。
2.1数据获取
这一部分主要为运用某种设备(大多为各种传感器)对目标的各种信息进行提取,并把这些信息转化为计算机可接收的数值或符号(串)集合。获取的数据大部分为瞬时值,也可以是目标一段时间内的特征值。准确的数据量测则是数据获取的关键,其量测方式分为可接触式和非接触式。接触式的量测方式有按压指纹,按压脚掌等;非接触式的量测方式有扫描人脸,录入语音等。而为了保证数据的准确性,量测时均要以不影响量测目标为前提进行。
2.2数据处理
数据处理的主要工作是排除干扰信息,只保存目标自身的性质以减小识别难度。因此需要用合适的滤波算法和处理技术将干扰因素排除。如人脸识别中要剔除对图像的亮度、对比度和清晰度等的干扰和阻碍,就要通过曝光补偿等技术还原原始的生物特征以顺利进行下一步的识别工作。
2.3特征提取
特征提取是模式识别系统中最为重要的一步。特征先经过检测从已过滤的数据中被抽取,所得到的成果称为特征向量。由于特征的独特性衍生出了“可重复性”,如不同环境下的同一目标所提取的特征应是相同的。一般来说,所候选的特征种类越多,获得的结果也越准确,但也可能会因其特征种类的过多即特征维数的过高而引发维数灾害——计算机难以求解的现象。
2.4分类决策
有了数据处理生成的模式特征空间,模式识别便进入最后的阶段——分类决策,完成后即可得出识别结果。模式分类所产生的学习策略分为两种:监督学习与非监督学习。监督学习通常是基于已得到的分类或描述的模式集合——训练集进行的。非监督学习不需要提供训练集,它是运用模式的统计规律或相似性学习来判断模式的类别的。此阶段的最后输出结果有两种,一种为对象所属类型,另一种为模板数据库中与对象最相似的模式编号。
3.模式识别的技术
随着人们安全意识的提高和社会的快速发展,再加上模式识别研究的不断深入,应用于各行各业的模式识别技术便开始出现并快速发展起来。模式识别技术有很多种,例如生物特征识别技术、工业产品检测等。接下来主要介绍一下生物特征识别技术中的人脸识别技术和语音识别技术。
3.1人脸识别
在日常生活中,我们识别一个人的身份通常依靠脸部特征。人脸识别也因与人们生活中的识别习惯更贴近,更具有直接性和简便性,为多数用户所接受。与指纹识别相比,人脸识别属于非接触式的量测方法,有利于降低用户的烦躁情绪,增加用户友好度。人脸识别的识别技术分为三个部分——人脸检测、人脸跟踪和人脸比对[2]。
3.1.1人脸检测
人脸检测是指在静态或动态的场景中判断是否存在人脸图像并分离出图像。人脸检测的方法有很多种,最常见的有参考模版法和样品学习法。参考模版法是先设计一个或多个标准面相的模板,再检测未知图像与标准模版之间的匹配程度,最后通过阈值判断是否存在人脸;样品学习法是运用人工神经网络的方法,通过对面相样品集和非面相样品集的学习产生分类器。
3.1.2人脸跟踪(不能跳)
人脸跟踪使用基于模型的方法来对检测到的对象进行动态目标跟踪。基于模型的跟踪方法即获取目标的几何模型,检测模型运动轨迹以达到跟踪目的。其中常用的有高斯模型法。高斯模型法将彩色图像转换为灰度图,每一个像素的灰度值对应该点与肤色的相似度,相似度最高即可确定该图像坐标。
3.1.3人脸比对
最后一步人脸比对,即将检测出的面相与数据库中已存的模版进行配对,并输出最相近的对象以进行身份确认。主要方法有特征向量法和面纹模板法。特征向量法首先确定人脸图像上五官轮廓的大小、位置、距离等,然后分别计算它们的几何特征量,最后转化为统一的识别该面相的几何特征向量。面纹模板法是先录入人脸进入模板库,输入检测出的待识别人脸时将待识别人脸的像素与库中所有模板采用相关量度量进行匹配。
3.2语音识别
语音是人们交流的重要媒介,与之相关的语音识别技术也因此受到极大重视,吸引众多学者们的大力研究,也开始应用于各个领域。在电信服务中,语音识别用于话务员协助服务的自动化、呼叫分配、分类订货等;在制造业中,出现了声控操纵的玩具车和玩具布偶;在爱心公益方面,语音识别系统开始为残疾人服务……语音识别技术应用越来越广泛,接下来重点介绍语音识别技术的基本结构和方法。 3.2.1语音识别技术的基本结构
相似地,语音识别技术分为三个基本结构——语音信号预处理,特征提取和模式匹配。
在预处理阶段,未知语音通過输入设备由声信号转化为电信号,再根据语音特点建立语音模型。在特征提取阶段,语音模型被加以分析并提取相关特征,形成语音模板存于数据库中。当需要识别时,要将未知对象建立的语音模型特征与数据库中的语音模板经过一定的匹配方法进行匹配,择出最佳模板后,再根据此模板定义通过查表得到相应模式编号,得到结果。
3.2.2语音识别的方法
语音识别方法多种多样,其中最理想的方法为隐马尔克夫模型。
隐马尔克夫模型是基于参数模型的统计识别方法,它通过反复训练形成与训练输出信号最相似的模型参数,识别时又将识别对象序列与HMM参数之间似然概率达到最大值时的最优状态序列作为输出结果。因此,与先储存好模式样板的方法相比,它能更好地描述语音信号的动态特性[3]。
二十世纪末期,出现了人工神经网络的语音识别方法,它通过模拟人类的神经活动进行工作,具有比其他语音识别方法更好的分类能力和输出——输入映射能力[4]。它的缺陷在于不能很好地描述时间序列的动态特性,因此研究者将其与隐马克尔夫模型相结合,取长补短,大大提高了语音识别的准确率和鲁棒性。
4.发展现状及展望
随着计算机与其外部硬件的不断发展、研究人员的不断探索,人们越来越认识到模式识别极高的应用价值和巨大的发展潜力。国内外越来越多的公司、政府机构、大学等都投身于模式识别的研究中,如中国科学院自动化研究所等。模式识别的应用也越来越广泛,并取得了不错的成绩,例如在工业领域,工厂利用模式识别来测量工业产品的各项参数是否达标;在天文领域,通过模式识别分析气象图识别天气状况;在医学领域,有运用模式识别进行医学图像分析等。随着研究的不断深入,模式识别将会越来越智能化、友好化,并朝着以知识为基础的方向发展。模式识别模式识别的日益发展也大力推动着人工智能的发展,使其应用方向越来越广,如在工业领域有智能设计、柔性制造、虚拟制造等,在金融领域有股票商利用其来进行分析、判断、决策等。
在不断发展的过程中,模式识别也面临着许多问题与挑战。特征提取是模式识别系统的关键,但在一些模式识别技术中,特征提取环节的方法决策还略显粗糙,需要不断提高更新。日趋智能化的模式识别符合时代潮流,研究者的大力投入与相关政策的颁布,使模式识别的未来充满无限可能。
参考文献
[1]范会敏,王浩.模式识别方法概述[J].电子设计工程,2012,20(19):48-51.
[2]吴巾一,周德龙.人脸识别方法综述[J].计算机应用研究,2009,26(09):3205-3209.
[3]黄子君,张亮.语音识别技术及应用综述[J].江西教育学院学报,2010,31(03):44-46.
[4]B. D. Ripley. 模式识别与神经网络[M]. 人民邮电出版社, 2009.
作者简介:蒋柳杰,民族:汉,性别:女,出生年月:2001年3月6日,籍贯:广西桂林市。
[关键词]模式识别;语音识别技术;人脸识别技术;发展现状
中图分类号:C61 文献标识码:A 文章编号:1009-914X(2018)46-0087-02
1.模式识别的基本概念
在日常生活中,人们经常需要根据事物相似的特征将其进行分类,再通过区分空间或时间中的同类事物中的不同,以获得对世界的认知,这是人们在无意识中进行的模式识别。模式是指人们对所看所闻的事物或现象的分类,比如电器、文具、建筑等;而模式识别即指识别分类中的样本,比如电脑、铅笔、云顶大厦等。模式识别的研究主要分为两大类:第一类是研究人类如何感知对象,第二类是研究计算机如何使用识别的理论和和方法进行工作。而识别又可再分为识别具体事物和识别抽象事物:识别具体事物主要是识别空间信息和时间信息两种,如人脸、虹膜、气象图等为空间信息,波形、信号等为时间信息;识别抽象事物是指对某个问题的解决方案的识别或对人类情绪的识别等[1]。
2.模式识别系统
模式识别的系统主要分为四个部分:数据获取,数据处理,特征提取和分类决策。
2.1数据获取
这一部分主要为运用某种设备(大多为各种传感器)对目标的各种信息进行提取,并把这些信息转化为计算机可接收的数值或符号(串)集合。获取的数据大部分为瞬时值,也可以是目标一段时间内的特征值。准确的数据量测则是数据获取的关键,其量测方式分为可接触式和非接触式。接触式的量测方式有按压指纹,按压脚掌等;非接触式的量测方式有扫描人脸,录入语音等。而为了保证数据的准确性,量测时均要以不影响量测目标为前提进行。
2.2数据处理
数据处理的主要工作是排除干扰信息,只保存目标自身的性质以减小识别难度。因此需要用合适的滤波算法和处理技术将干扰因素排除。如人脸识别中要剔除对图像的亮度、对比度和清晰度等的干扰和阻碍,就要通过曝光补偿等技术还原原始的生物特征以顺利进行下一步的识别工作。
2.3特征提取
特征提取是模式识别系统中最为重要的一步。特征先经过检测从已过滤的数据中被抽取,所得到的成果称为特征向量。由于特征的独特性衍生出了“可重复性”,如不同环境下的同一目标所提取的特征应是相同的。一般来说,所候选的特征种类越多,获得的结果也越准确,但也可能会因其特征种类的过多即特征维数的过高而引发维数灾害——计算机难以求解的现象。
2.4分类决策
有了数据处理生成的模式特征空间,模式识别便进入最后的阶段——分类决策,完成后即可得出识别结果。模式分类所产生的学习策略分为两种:监督学习与非监督学习。监督学习通常是基于已得到的分类或描述的模式集合——训练集进行的。非监督学习不需要提供训练集,它是运用模式的统计规律或相似性学习来判断模式的类别的。此阶段的最后输出结果有两种,一种为对象所属类型,另一种为模板数据库中与对象最相似的模式编号。
3.模式识别的技术
随着人们安全意识的提高和社会的快速发展,再加上模式识别研究的不断深入,应用于各行各业的模式识别技术便开始出现并快速发展起来。模式识别技术有很多种,例如生物特征识别技术、工业产品检测等。接下来主要介绍一下生物特征识别技术中的人脸识别技术和语音识别技术。
3.1人脸识别
在日常生活中,我们识别一个人的身份通常依靠脸部特征。人脸识别也因与人们生活中的识别习惯更贴近,更具有直接性和简便性,为多数用户所接受。与指纹识别相比,人脸识别属于非接触式的量测方法,有利于降低用户的烦躁情绪,增加用户友好度。人脸识别的识别技术分为三个部分——人脸检测、人脸跟踪和人脸比对[2]。
3.1.1人脸检测
人脸检测是指在静态或动态的场景中判断是否存在人脸图像并分离出图像。人脸检测的方法有很多种,最常见的有参考模版法和样品学习法。参考模版法是先设计一个或多个标准面相的模板,再检测未知图像与标准模版之间的匹配程度,最后通过阈值判断是否存在人脸;样品学习法是运用人工神经网络的方法,通过对面相样品集和非面相样品集的学习产生分类器。
3.1.2人脸跟踪(不能跳)
人脸跟踪使用基于模型的方法来对检测到的对象进行动态目标跟踪。基于模型的跟踪方法即获取目标的几何模型,检测模型运动轨迹以达到跟踪目的。其中常用的有高斯模型法。高斯模型法将彩色图像转换为灰度图,每一个像素的灰度值对应该点与肤色的相似度,相似度最高即可确定该图像坐标。
3.1.3人脸比对
最后一步人脸比对,即将检测出的面相与数据库中已存的模版进行配对,并输出最相近的对象以进行身份确认。主要方法有特征向量法和面纹模板法。特征向量法首先确定人脸图像上五官轮廓的大小、位置、距离等,然后分别计算它们的几何特征量,最后转化为统一的识别该面相的几何特征向量。面纹模板法是先录入人脸进入模板库,输入检测出的待识别人脸时将待识别人脸的像素与库中所有模板采用相关量度量进行匹配。
3.2语音识别
语音是人们交流的重要媒介,与之相关的语音识别技术也因此受到极大重视,吸引众多学者们的大力研究,也开始应用于各个领域。在电信服务中,语音识别用于话务员协助服务的自动化、呼叫分配、分类订货等;在制造业中,出现了声控操纵的玩具车和玩具布偶;在爱心公益方面,语音识别系统开始为残疾人服务……语音识别技术应用越来越广泛,接下来重点介绍语音识别技术的基本结构和方法。 3.2.1语音识别技术的基本结构
相似地,语音识别技术分为三个基本结构——语音信号预处理,特征提取和模式匹配。
在预处理阶段,未知语音通過输入设备由声信号转化为电信号,再根据语音特点建立语音模型。在特征提取阶段,语音模型被加以分析并提取相关特征,形成语音模板存于数据库中。当需要识别时,要将未知对象建立的语音模型特征与数据库中的语音模板经过一定的匹配方法进行匹配,择出最佳模板后,再根据此模板定义通过查表得到相应模式编号,得到结果。
3.2.2语音识别的方法
语音识别方法多种多样,其中最理想的方法为隐马尔克夫模型。
隐马尔克夫模型是基于参数模型的统计识别方法,它通过反复训练形成与训练输出信号最相似的模型参数,识别时又将识别对象序列与HMM参数之间似然概率达到最大值时的最优状态序列作为输出结果。因此,与先储存好模式样板的方法相比,它能更好地描述语音信号的动态特性[3]。
二十世纪末期,出现了人工神经网络的语音识别方法,它通过模拟人类的神经活动进行工作,具有比其他语音识别方法更好的分类能力和输出——输入映射能力[4]。它的缺陷在于不能很好地描述时间序列的动态特性,因此研究者将其与隐马克尔夫模型相结合,取长补短,大大提高了语音识别的准确率和鲁棒性。
4.发展现状及展望
随着计算机与其外部硬件的不断发展、研究人员的不断探索,人们越来越认识到模式识别极高的应用价值和巨大的发展潜力。国内外越来越多的公司、政府机构、大学等都投身于模式识别的研究中,如中国科学院自动化研究所等。模式识别的应用也越来越广泛,并取得了不错的成绩,例如在工业领域,工厂利用模式识别来测量工业产品的各项参数是否达标;在天文领域,通过模式识别分析气象图识别天气状况;在医学领域,有运用模式识别进行医学图像分析等。随着研究的不断深入,模式识别将会越来越智能化、友好化,并朝着以知识为基础的方向发展。模式识别模式识别的日益发展也大力推动着人工智能的发展,使其应用方向越来越广,如在工业领域有智能设计、柔性制造、虚拟制造等,在金融领域有股票商利用其来进行分析、判断、决策等。
在不断发展的过程中,模式识别也面临着许多问题与挑战。特征提取是模式识别系统的关键,但在一些模式识别技术中,特征提取环节的方法决策还略显粗糙,需要不断提高更新。日趋智能化的模式识别符合时代潮流,研究者的大力投入与相关政策的颁布,使模式识别的未来充满无限可能。
参考文献
[1]范会敏,王浩.模式识别方法概述[J].电子设计工程,2012,20(19):48-51.
[2]吴巾一,周德龙.人脸识别方法综述[J].计算机应用研究,2009,26(09):3205-3209.
[3]黄子君,张亮.语音识别技术及应用综述[J].江西教育学院学报,2010,31(03):44-46.
[4]B. D. Ripley. 模式识别与神经网络[M]. 人民邮电出版社, 2009.
作者简介:蒋柳杰,民族:汉,性别:女,出生年月:2001年3月6日,籍贯:广西桂林市。