婴儿啼器声的特征分析与识别

来源 :西华大学 | 被引量 : 0次 | 上传用户:wonderful_world
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对婴儿来说,啼哭声是一种通讯的方式,一个非常有限的,但类似成年人进行交流的方式。它也是一种生物报警器,向外界传达着婴儿生理和心理的需求。   基于啼哭声声波携带的信息,婴儿的身体状况才能被确定,疾病才能被检测出来。因此,有效辨识啼哭声,成功地将婴儿啼哭声“翻译”成“成人语言”,让我们能够读懂啼哭声的含义,有重大的实际意义。   由于婴儿啼哭声与语音的关联,现在有越来越多的研究人员着手将语音处理技术和模式识别的方法运用在婴儿啼哭声的分类上,随着语音处理技术的高速发展,也为婴儿啼哭声的识别提供了强有力的支持。   本文对婴儿啼哭声的分类识别进行了一定程度的研究,所做的工作主要有以下几个部分:   将婴儿与成年人在发声结构和发声原理上分别进行了比较,了解两者的异同。从婴儿啼哭声的特性上入手,采用合适的技术对其进行分析处理。   数据库的建立。由于目前没有统一规范的婴儿啼哭声数据库,而且研究者所在的领域不同,对婴儿啼哭声分析的侧重点也不同,造成了对婴儿啼哭声类别的划分有多种方式。综合考虑各方面的因素,在实验中,对婴儿啼哭声是按照疼痛和非疼痛来进行划分。   预处理分析过后,重点讨论婴儿啼哭声的参数提取,通过分析常用的特征参数,包括线性预测系数(LPC)、线性预测倒谱系数(LPCC)、Mel倒谱系数(MFCC)等,分析各自的优势和不足,选用MFCC参数用于婴儿啼哭声分析中,并选取不同的阶次来观察对疼痛的和非疼痛的婴儿啼哭声识别率的影响。考虑到婴儿声道构造独特,通常啼哭声的基音频率较高,而MFCC参数对婴儿啼哭声在其高频部分的信息提取工作不如在其低频部分的效果好,因此另外引用一种反向Mel频率倒谱系数,即IMFCC,这种参数对婴儿啼哭声的高频部分的信息获取具有很大的优势,与MFCC形成了优势互补。将MFCC与IMFCC两者结合使用,即形成组合特征,同样也选取不同的阶次来考察对疼痛的和非疼痛的婴儿啼哭声识别率的影响。最终,通过实验结果验证,使用组合特征的识别率要比单独使用一种参数时有所提高。   对婴儿啼哭声的识别算法分析中,探讨了三种常用的识别算法,但根据当前样本较少、婴儿啼哭声的特性、以及运算量的大小三个方面的综合考虑,确定将在孤立词的识别中运用非常广泛的DTW算法用于对疼痛的和非疼痛的婴儿啼哭声的识别中。  
其他文献
随着网络技术和计算机软件的发展,SOA(面向服务架构)已经逐渐成为软件产品开发和系统建设的主导方法。对于一个基于SOA的应用系统而言,客户不再仅仅满足于服务的功能的正确性
随着移动设备的普及和定位技术的发展,移动对象所产生的轨迹数据规模呈爆炸式增长,如何从海量轨迹数据集中挖掘出有意义的信息越来越受到国内外学者的关注。轨迹预测技术是轨
基于视频流的人脸检测与跟踪是计算机视觉与模式识别领域的一个重要的研究课题,也是人脸信息处理领域的一项关键技术,已经成为研究者广泛关注的热点问题。自动人脸检测与跟踪
BPEL(业务流程执行语言)是一门用于自动化业务流程的形式规约语言,对Web服务组合进行描述。它也是一种使用XML编写的编程语言,提供了一个抽象的并可执行的业务流程。而Apache
本文研究了智能剪刀方法、边缘吸附方法、基于区域划分的彩色医学图像分割方法和基于样条回归模型的分割方法。   智能剪刀是一种非常经典的半自动图像分割方法。它使用拉
随着网络技术的快速发展,计算机网络已经渗透到人们生活的各个角落,网络的服务质量也越来越受到人们的重视。认知网络是未来智能网络的发展方向,它具有认知过程和学习功能,具
传统的光滑粒子流体动力学(SPH)软件是采用面向过程方法设计,分离了数据与操作,通过过程函数来访问复杂的数据结构,制约了程序的维护与扩展,并且SPH方法的数值模拟具有一定的
语义网是当前万维网的一种延伸,其目的在于将万维网中的简单数据提升到语义层次,便于知识的共享及用机器对数据进行处理。本体(Ontology)技术是实现语义网的关键技术之一。它
随着时代的进步,中国经济的蓬勃发展,一些乡镇经济也开始逐渐好转,陆续地运用计算机来处理一些相关事务。同时,乡镇司法所是基层政权建设的重要组成部分,并且司法所维护社会
随着科学技术的发展,无线多媒体传感器网络的运用范围越来越广,而路由协议是数据传输的基础,在传统的无线传感器网络领域,虽然已经有很多学者已经提出了许多的多路径路由协议