汉语语音的物理特征提取及分析工具的研究与实现

来源 :东华大学 | 被引量 : 0次 | 上传用户：qq4156500

【摘要】

：

声学特征的提取是语音识别（包括说话人识别）的关键技术之一，目的是通过对语音信号进行数字处理，将其表示成反映语音本质特征信息的参数序列。当前，包括反映人的听觉感知特性的、具

【作者】

：

辜少鹏

【机构】

：

东华大学

【出处】

：

东华大学

【发表日期】

：

2010年期

【关键词】

：

汉语语音识别 Mel频率语谱图临界频带滤波器组 Speechlab工具物理特征提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

声学特征的提取是语音识别（包括说话人识别）的关键技术之一，目的是通过对语音信号进行数字处理，将其表示成反映语音本质特征信息的参数序列。当前，包括反映人的听觉感知特性的、具有更强的鲁棒性的特征的提取，是语音识别领域的一个研究热点。近年来，国际上对语音特征提取的研究，大多是从英语出发的，而汉语与英语比，具有一些不同的特点，因此，加紧开展汉语语音特征提取方面的研究是非常有必要的。本论文对汉语语音信号的分析和特征的提取进行了一些研究，具体包括:　　 1.设计了在汉语语音分析中常用的语谱图的Matlab显示算法。　　 2.研究了听觉的音高感知特性和Mel频率语谱图，并设计了相应的Matlab算法。　　 3.研究了听觉的“临界频带”理论，并为200～9500Hz频率范围内的20个临界频带设计了相应的20个FIR滤波器，以此构成一个滤波器组，来近似地模拟人耳基底膜在200～9500Hz频率范围内的频谱分析能力。　　 4.设计了在汉语语音的音节切分中常用的短时能量特征和短时平均过零率特征的Matlab提取算法。　　 5.研究了在说话人识别中，利用统计学对特征参数的性能进行评价的方法，并进行了相应的Matlab算法设计。　　 6.整合以上功能，开发了工具Speechlab。　　 7.采集大量的说话人语音样本，利用工具，评价目前在汉语说话人识别中常用的MFCC特征和LPC特征的性能，以及MFCC的各维参数对说话人识别的贡献。　　作者希望Speechlab工具能为汉语语音信号分析和特征提取方面的研究提供帮助。

其他文献

移动IPv6切换优化及性能研究

随着无线接入技术的发展,移动性成为下一代因特网不可缺少的特征,在IP层引入移动性通过融合不同的无线接入技术,可以为各种应用提供统一的传输平台。当移动用户频繁的进行区

学位

移动IPv6移动锚点区域锚点域间切换动态级联切换延迟

基于动态阈值的切换时机优化

随着各种无线网络技术的发展,以及市场需求和竞争的变革,下一代无线通信网络将是各种无线接入技术并存并协同工作的全IP融合的异构网络。而各种无线网络的融合必然会带来许多

学位

垂直切换动态阀值切换时机机会约束规划机会成本

基于心电图的身份识别鲁棒性研究

在物联网迅速普及的今天,心电图(Electrocardiogram,ECG)信号身份识别在可穿戴设备上的应用有巨大的前景。由于可移动设备的特点,要求ECG信号采集设备的集成度较高,采集的数

学位

ECG信号多态平均模板多层识别多维多层识别

多维空间信息加密之二维化信息的三维化加密算法研究

象棋在博弈时变化万千,无能是中国象棋还是国际象棋,都经历了几千年而经久不衰。随着现代计算机技术的飞速发展,各种象棋软件的出现,但到目前还没有人能开发出一套必胜的象棋

学位

原始信息表明文密文行信息列信息二维化信息

容错处理器阵列的高效重构技术

随着超大规模集成电路(VLSI)设计技术和集成工艺的不断发展，芯片上的处理单元的集成度越来越高。这些被集成的处理单元以网状连接形式形成阵列。对于数量众多的处理单元来说，如

学位

超大规模集成电路容错处理器阵列高效重构开关机制优化算法

易用型增强现实系统开发工具的设计与应用

本文提出一种基于GUI操作的通用增强现实开发模型-GPDMAR,并以此模型为指导,在Windows平台上开发了面向非专业人员的易用型开发工具EasyAR系统。另外,作者还利用EasyAR实现了

学位

增强现实计算机视觉GPDMAR(通用增强现实开发模型)EasyAR系统

精确增量式支持向量机的研究与应用

自20世纪90年代中期由Vapnik等人提出支持向量机(SVMs)，由于其具有通用性、鲁棒性以及良好推广性等特点，已经成为解决分类、回归等统计学习问题一种流行的技术，并广泛应用于数据

学位

支持向量机增量式学习排列学习解路径核方法收敛性分析最大间隔原则机器学习

基于JPEG2000的图像容错方法研究

随着互联网技术的飞速发展，网络中传输的多媒体信息数量也在不断增加。同时，人们对网络传输质量的要求也在不断提高。然而，在现实网络中却存在诸多不稳定因素，如丢包或位错误等，这

学位

图像容错网络传输质量压缩算法码流特点

数字图像版权保护技术的一些研究

计算机的普及和互联网的快速发展，使得数字图像常常被非法复制并随意传播，其版权保护需求日益迫切。目前，用于图像版权保护的技术主要有两种：数字水印技术和基于内容的图像拷贝检

学位

版权保护数字水印拷贝检测小波变换鲁棒性

无线传感器网络中故障容忍的事件定位算法研究

微电子技术、计算技术和无线通信等技术的进步，推动了低功耗多功能传感器的快速发展，使其在微小体积内能够集成信息采集、数据处理和无线通信等功能。目前，无线传感器网络广泛应

学位

无线传感器网络事件定位算法故障容忍节点观测值DSNAP

汉语语音的物理特征提取及分析工具的研究与实现

与本文相关的学术论文