基于小波变换的语音端点检测及汉语声韵母声学特性研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:zohan_rfs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别以语音为研究对象,是语音信号处理的一个重要研究方向.近二三十年来,语音识别技术取得了很大的进展,其产品也广泛应用于各个领域.计算机与人类的自然交流成为语音识别技术发展的终极目标.需求的迫切性也使语音识别技术得到国内外研究机构、厂商的广泛重视.语音识别建立在语音信号短时分析的基础上,利用语音信号的短时平稳性,对语音信号进行时域、频域、倒频域分析,从而得出语音信号短时特征和短时参数.(1)该论文提出了一种基于小波变换的语音段起止端点检测算法.传统的语音段起止端点检测算法大都是在时域上根据能量累积的大小判别语音段和噪声段.这些算法只是适用于高信噪比的情况.对于低信噪比的情况,这些算法往往要借助平均过零率等辅助特征.这样做不但增加了算法的复杂度,而且也未必奏效.该文根据小波变换的特性,针对主要由白色噪声组成的噪声背景,提出一种新的语音段起止端点检测算法.这种算法根据白色噪声在小波变换域各个子带的平均能量变化平缓的特点判别语音段和噪声段.实验结果表明,该论文提出的算法即使在低信噪比的情况下也能正确判别语音段和噪声段.(2)不论何种语言,都有元音和辅音两种音素,元音为浊音,辅音则可分类成清辅音和浊辅音.浊音能量较大,有一定的周期性.清音能量较小,没有周期性,但平均过零率较高.对于汉语来说,汉字的音节由声母和韵母组成.韵母主要表现为浊音的声学特征,而一部分声母表现为浊音的声学特征,一部分则表现为清音.因此,如果要从一段汉语语音信号中提取单个汉字,就必须区分韵母浊音和声母浊音的不同.该文通过大量的统计观察和分析,首次总结出一些韵母浊音和声母浊音的声学特征.这些声学特征对于研究语音信号中单个汉字的提取算法有着重要的参考价值.
其他文献
该文结合目前协议测试理论的最新研究成果,并以在普天研究院的UMTS核心网SGSN设备的研发经验为背景,论述了SGSN-Server测试的分析研究、设计和实现.该论文首先分析了UMTS的网
DVB作为世界3大数字电视标准之一,目前已经有300多个成员.它包括了卫星(DVB-S)、电缆电视(DVB-C)和地面广播(DVB-T)3个主要标准.而DVB-T作为DVB系统中最复杂的一个传输标准,
随着有线电视的发展,HFC(Hybrid Fibre Coax-光缆电缆混合)网的建设得到了飞速发展,由于HFC网的宽带特性、丰富的频率资源、方便的接入手段和相对较低的费用,人们非常希望将
随着Internet和光纤技术的迅猛发展,IP和光网络技术的相互融合必将成为未来网络发展的重要趋势.如何解决IP层与光层的融合,GMPLS提供了一个良好的思路.GMPLS继承了几乎所有MP
无线网络优化是以降低无线信道掉话率和拥塞率,提高接通率、切换成功率等无线指标为目的.无线网优工作迫切需要理论方法的指导和实际经验的总结.该论文主要针对爱立信GSM 900
在航空航天系统中,要实现信息的传输,信息交换是关键技术之一。近年来,以太网技术发展迅速,分组交换因此得到了广泛应用,但是传统的以太网交换单元并不适宜直接应用于航空航天系统
随着社会不断发展,通信业也日新月异.第三代移动通信系统逐渐开始商用,而下一代的移动通信系统也逐渐成为研究的热点.宽带、高速通信已是发展的必然.这一方面要求系统具有良
随着无线网络和多媒体数字信号处理技术的发展,无线多媒体通信系统开始得到越来越广泛的应用.在实现无线多媒体通信终端设备时,采用高性能的DSP为核心,使用运行在嵌入式操作
在知识经济时代,知识和资源的管理、传递和创新已经成为推动企业发展的第一要素。同时,知识作为企业的重要资源,也影响到企业的核心竞争力。除了对传统的物流,资金流进行管理
近年来,诸如人人网,新浪微博,脸谱网,推特等社会网络在人们的生活中发挥着越来越大的作用,而随着社会网络的蓬勃发展,对于社会网络的研究也越来越受到重视。通过社会网络社团结构的