甚低速率波形内插语音编码研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:webtvwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在低速率语音编码领域,波形内插(WI)语音编码算法性能优良,具有十分重要的理论研究意义和实际应用价值。本文针对WI语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法。 在特征波形分解问题上,本文提出了二维非负矩阵分解(2D-NMF)语音特征波形(CW)的方法。它是根据CW幅度谱矩阵列方向的频率变化特性以及行方向的波形慢渐变特性,对其进行列非负矩阵分解和行非负矩阵分解,从而在行和列两个方向上同时压缩CW幅度谱矩阵的维数。该分解方法带来了量化方面的优势,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化。 本文基于2DNMF-WI模型,按帧对语音数据进行语音分析和参数提取,提取的参数包括:线谱频率(LSF)、基音周期、功率和编码矩阵。在甚低速率语音编码中,由于没有足够的比特数来描述上述参数,往往很难得到高质量的合成语音。本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)、分裂式矩阵量化等技术降低编码速率,保证合成语音的质量。 最后,将本文提出的1kb/s2DNMF-WI语音编码算法进行了主观听音测试,并将此算法与原2kb/s NMF-WI编码算法相比较。判断韵字测试(DRT)结果表明,1kb/s2DNMF-WI语音编码算法获得的重建语音清晰度为良。MOS分测试结果显示,1kb/s2DNMF-WI编码器的质量稍差于2kb/s NMF-WI编码器。
其他文献
氧化葡萄糖酸杆菌(G.oxydans)是一类体积小,专性好氧的革兰氏阴性菌,该菌含多种酶可以不完全氧化有机物产生多种重要化合物,这使得氧化葡萄糖酸杆菌在工业生物催化中占有不可或
植物三维形态发育的分子机理研究一直是植物科学关注的研究领域,其中一个热点是探讨植物器官的形状和大小如何被决定。在模式植物(如拟南芥等)的研究表明,器官的形状和大小受到严
可靠性问题涉及到了社会的各个方面,在其发展过程中,为了对系统进行可靠性分析,人们提出了许多分析方法,其中模型分析方法因为其优越性脱颖而出。随着系统复杂性的增加和软件故障
随着社会的不断发展,人们对水工建筑提出了越来越高的设计需求.尤其是最近几年,全国各地水工建筑物项目越来越多,需要充分提升建筑物的抗震设计,保证建筑物的稳定性.主要围绕
平板显示器在生产过程中由于受原材料、生产设备、工艺水平和生产环境等因素的影响,不可避免的存在各种各样的缺陷。缺陷的存在使得显示质量变差,甚至导致产品的报废,造成人力、
光传输系统是现代通信网络的核心部分,随着通信数据量的增长,对传输系统传输速率的需求也越来越大。于是,高速光传输系统开始受到越来越多的关注。本论文在充分分析光纤传输
毫米波微带天线因其波长短、频带宽、尺寸小等优点,自其产生之日起,就受到世界各国研究人员的广泛关注,特别是在航天飞行器以及雷达系统的天线设计中,毫米波微带天线更是扮演着重
低损耗、可调谐的新型铁电材料可广泛应用于相控阵天线以及微波通讯系统中。钙钛矿铁电材料因其具有较高的调谐率,成为近年来微波调谐应用材料研究的热点。但本身较高的介电
乙肝病毒(HBV)的感染一直是一个重大的公共卫生问题,全球约有三亿五千万慢性乙肝感染患者。每年约有近一百万人死于由HBV感染引起的肝衰竭,肝硬化以及肝癌等疾病。乙肝感染者中
随着社会的发展与提高,人们也在关注着教育事业的成长,而主导教育事业的直接者就是教师,教师的成长因素分为外部因素和自身因素,也就是个人因素,为了保证教师的专业素养达到要求,所