汉语语音的物理特征提取及分析工具的研究与实现

来源 :东华大学 | 被引量 : 0次 | 上传用户:qq4156500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声学特征的提取是语音识别(包括说话人识别)的关键技术之一,目的是通过对语音信号进行数字处理,将其表示成反映语音本质特征信息的参数序列。当前,包括反映人的听觉感知特性的、具有更强的鲁棒性的特征的提取,是语音识别领域的一个研究热点。近年来,国际上对语音特征提取的研究,大多是从英语出发的,而汉语与英语比,具有一些不同的特点,因此,加紧开展汉语语音特征提取方面的研究是非常有必要的。本论文对汉语语音信号的分析和特征的提取进行了一些研究,具体包括:   1.设计了在汉语语音分析中常用的语谱图的Matlab显示算法。   2.研究了听觉的音高感知特性和Mel频率语谱图,并设计了相应的Matlab算法。   3.研究了听觉的“临界频带”理论,并为200~9500Hz频率范围内的20个临界频带设计了相应的20个FIR滤波器,以此构成一个滤波器组,来近似地模拟人耳基底膜在200~9500Hz频率范围内的频谱分析能力。   4.设计了在汉语语音的音节切分中常用的短时能量特征和短时平均过零率特征的Matlab提取算法。   5.研究了在说话人识别中,利用统计学对特征参数的性能进行评价的方法,并进行了相应的Matlab算法设计。   6.整合以上功能,开发了工具Speechlab。   7.采集大量的说话人语音样本,利用工具,评价目前在汉语说话人识别中常用的MFCC特征和LPC特征的性能,以及MFCC的各维参数对说话人识别的贡献。   作者希望Speechlab工具能为汉语语音信号分析和特征提取方面的研究提供帮助。
其他文献
随着无线接入技术的发展,移动性成为下一代因特网不可缺少的特征,在IP层引入移动性通过融合不同的无线接入技术,可以为各种应用提供统一的传输平台。当移动用户频繁的进行区
随着各种无线网络技术的发展,以及市场需求和竞争的变革,下一代无线通信网络将是各种无线接入技术并存并协同工作的全IP融合的异构网络。而各种无线网络的融合必然会带来许多
在物联网迅速普及的今天,心电图(Electrocardiogram,ECG)信号身份识别在可穿戴设备上的应用有巨大的前景。由于可移动设备的特点,要求ECG信号采集设备的集成度较高,采集的数
象棋在博弈时变化万千,无能是中国象棋还是国际象棋,都经历了几千年而经久不衰。随着现代计算机技术的飞速发展,各种象棋软件的出现,但到目前还没有人能开发出一套必胜的象棋
随着超大规模集成电路(VLSI)设计技术和集成工艺的不断发展,芯片上的处理单元的集成度越来越高。这些被集成的处理单元以网状连接形式形成阵列。对于数量众多的处理单元来说,如
本文提出一种基于GUI操作的通用增强现实开发模型-GPDMAR,并以此模型为指导,在Windows平台上开发了面向非专业人员的易用型开发工具EasyAR系统。另外,作者还利用EasyAR实现了
自20世纪90年代中期由Vapnik等人提出支持向量机(SVMs),由于其具有通用性、鲁棒性以及良好推广性等特点,已经成为解决分类、回归等统计学习问题一种流行的技术,并广泛应用于数据
随着互联网技术的飞速发展,网络中传输的多媒体信息数量也在不断增加。同时,人们对网络传输质量的要求也在不断提高。然而,在现实网络中却存在诸多不稳定因素,如丢包或位错误等,这
计算机的普及和互联网的快速发展,使得数字图像常常被非法复制并随意传播,其版权保护需求日益迫切。目前,用于图像版权保护的技术主要有两种:数字水印技术和基于内容的图像拷贝检
微电子技术、计算技术和无线通信等技术的进步,推动了低功耗多功能传感器的快速发展,使其在微小体积内能够集成信息采集、数据处理和无线通信等功能。目前,无线传感器网络广泛应