基于压缩感知的低速率语音编码器的研究及实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:hlg1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
压缩感知(Compressed Sensing,CS)打破了人们对传统奈奎斯特采样定理认知的约束,可在低采样率条件下实现信号高质量的重建。低速率语音编码器采用参数编码技术,编码速率低,所需传输带宽小,可应用于卫星移动通信、水下通信和军事通信等领域。低速率语音编码技术是提高无线通信中频带利用率的有效方法之一,研究并实现具有较高合成语音质量的低速率语音编码器具有实际的应用价值。本文把CS理论用于语音特征参数的高效量化,解决了不同稀疏度语音信号的分类重构问题,并实现了一种速率为1kbps语音编码器。线谱对参数(Linear Sepctrum Frequency,LSF)是语音重要的声道模型参数,在编码过程中分配的量化比特数最多。为了用尽可能少的比特数实现对LSF的透明量化,本文提出了一种基于压缩感知的自适应重构算法(Adaptive Reconstruction Algorithm for Compressed Sensing,ARA-CS)。该算法首先对语音帧的LSF参数采用CS方法进行观测;在重构时,根据语音帧的清/浊类型,自适应地选择调整参数,根据不同的调整参数值确定感知矩阵的维数,利用线性方程求解或最小二乘法得到LSF参数的前一部分稀疏系数,后部分补0;最后进行稀疏反变换求得重构的LSF参数。该算法同样适用于连续多帧LSF参数的观测和重构。采用平均重构信噪比和谱失真性能指标对算法性能进行评估,测试结果表明,本文算法对浊音帧和多帧联合编码的LSF重构效果优于传统CS算法。本文在MELP编码模型基础上,采用多帧联合编码技术和本文提出的ARA-CS算法,设计了一个1kbps的语音编解码器。编码端把语音信号分为30ms长的子帧,连续2个子帧组成一个超帧,根据子帧的清/浊类型,将超帧分为4种结构,每种超帧结构用60bit进行量化编码。采用ARA-CS算法利用不同的调整参数对不同超帧类型的LSF参数进行观测和重构,得到低维的观测序列,再对其进行矢量量化编码。编码所需量化码本也通过ARA-CS算法训练,并根据调整参数调整码本维度。采用PESQ和DRT对所设计的编码器进行测试,结果表明,该编码器的平均MOS值为2.64,DRT得分为87.29%,合成语音具有较好的清晰度与可懂度。
其他文献
本体系结构是一个软件行业非常值得研究的课题,研究了2种通用开放的软件体系结构,主要介绍了国内外典型的软件体系结构及其应用原理。
从技师学院数学教学的现状出发,本文探讨了技师学院生源文化素质低的问题,分析了技师学院数学教学现状,提出了相应的教学改革思路。
目的研究分析心理护理对于卵巢囊肿手术患者的临床应用效果及实施方法。方法选取2016年1月至2019年5月在我院进行手术治疗的卵巢囊肿患者72例,随机性将72例患者平均分为两组,
<正>一、氢内冷发电机转子的氢路系统目前运行中的氢内冷汽轮发电机转子,大都采用“气隙取气斜流式”风路系统,它的结构形式是多种多样的,现就目前国内较为普遍的两种形式分
张元济一生对古籍整理呕心沥血,贡献卓著。从收集古籍、校印古籍方面,论述了张元济古籍整理的卓越成就,并分析其成因。 Zhang Yuanji devoted painstaking efforts to the a
在技师学院教学体系中,数学是一门重要学科,其不仅能拓展学生的思维,提升学生的创新能力,且对学生今后的发展有很大帮助。鉴于此,文章分析了技师学院数学课程教学的现状,论述
考察了在不同基质含量、pH及温度条件下,磷酸盐对厌氧氨氧化(Anammox)反应器脱氮性能的影响。结果表明,在温度30℃、pH为7.8~8.2,高基质含量下,TP的抑制质量浓度为70 mg/L,而在低基质
"顾客是上帝"体现了企业营销观念的转变,但这一口号并没有完全体现现代市场营销观念的内涵和实质.在这一口号的指引下,企业易犯重视现实市场、忽视潜在市场的错误.同时,顾客
为优化配置地铁站的自动售票机数目,将自动售票过程抽象为具有状态相关性和容量限制的单服务台排队系统。基于实际调查数据发现,客流到达间隔和自动售票时间分别服从对数正态分
研究了基于PLC的运料小车变频器设计,利用PLC与变频器控制电动机实现多段速调控,实现了运料小车自动往返稳定运动控制,出发地停十秒装货,目的地停十秒卸货。