基于RASTA-PLP的MELP语音编码算法研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:znchen1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
混合激励线性预测语音编码算法(Mixed Excitation Linear Prediction,MELP)作为低速率语音编码算法中的代表,在2.4kb/s速率上取得了较好的合成语音质量,且具有编码速率低,带宽需求小的特点。但2.4kb/s标准MELP语音编码算法在强噪环境下合成语音质量不高,限制了其在地下通信,水下通信,钢轨通信等特殊通信系统中的语音通信应用。本文改进2.4kb/s标准MELP语音编码算法的线性预测分析技术,构建了2.4kb/s新型MELP语音编码算法,目的是提高MELP低速率语音编码算法的合成语音质量和抗噪声性能,以提高特殊通信条件下的语音通信质量。通过分析融合基于人耳听觉频谱动态特征的RASTA(Rel Ative Spec Tr A)滤波技术与基于人耳工程经验的感知线性预测分析技术(Perceptually Linear Prediction,PLP),得到RASTA-PLP分析技术,所提取的语音特征参数相比于传统线性预测(Linear Predictive Coding,LPC)参数包含更多的人耳听觉信息,但RASTA-PLP分析技术在语音参数提取准确度上仍有较大的提升空间。本文在改进RASTA-PLP分析技术的基础上,构建了2.4kb/s基于RASTA-PLP的MELP语音编码算法模型。论文的主要研究内容有:(1)将RASTA滤波技术与PLP分析技术融合,得到RASTA-PLP分析技术,并同时采用扩展卡尔曼滤波、最小均方误差噪声估计、一阶差分技术来改进RASTA-PLP分析技术。对改进后的RASTA-PLP分析技术进行语音参数识别准确率分析,结果表明改进后的RASTA-PLP分析技术语音参数识别准确率较高,性能优于传统RASTA-PLP分析技术和LPC分析技术。(2)将改进的RASTA-PLP分析技术应用到2.4kb/s标准MELP语音编码算法中,代替标准算法中的LPC线性预测分析,构建2.4kb/s基于RASTA-PLP的MELP语音编码算法。利用Matlab进行算法语音编解码仿真,并对解码语音波形和原始语音波形进行相似度对比。结果表明基于RASTA-PLP的MELP语音编码算法解码语音能够较好的还原原始语音,解码语音波形质量较高。(3)利用Matlab对基于RASTA-PLP的MELP语音编码算法进行性能分析。分别在理想无噪声和有噪声背景下,对2.4kb/s基于RASTA-PLP的MELP语音编码算法和2.4kb/s标准MELP语音编码算法进行了解码语音波形质量,解码语音平均意见值(Mean Opinion Score,MOS)的对比分析;对2.4kb/s基于RASTA-PLP的MELP语音编码算法和其他改进低速率语音编码算法进行了解码语音MOS平均分的对比分析。结果表明,与2.4kb/s标准MELP语音编码算法和其他改进甚低速率MELP语音编码算法相比,所构建的MELP算法具备较高的合成语音质量和抗噪声性能。(4)分析基于RASTA-PLP的MELP语音编码算法的可行性。利用树莓派进行基于RASTA-PLP的MELP语音编码算法的硬件仿真,测试解码语音波形质量和解码语音MOS得分;在理想无噪声和有噪声背景下,对2.4kb/s基于RASTA-PLP的MELP语音编码算法、2.4kb/s标准MELP语音编码算法和其他两种改进甚低速率MELP语音编码算法进行了树莓派硬件资源占有率,算法平均运行时间的对比分析。结果表明基于RASTA-PLP的MELP语音编码算法树莓派解码语音质量较高,与算法Matlab仿真结果基本一致;硬件资源占有率和平均运行时间与2.4kb/s标准MELP语音编码算法基本接近,与其他两种改进甚低速率MELP语音编码算法差异不大,所构建的MELP算法具备较高的可行性。
其他文献
检波器作为射频微波接收电路系统中经常用到的器件,在仪器测试、设备功率检测中发挥着重要的作用,高速检波成为了国内外研究的热点。随着对石墨烯非线性的深入研究,证明了在电磁波和直流偏置同时作用下,石墨烯的偶次谐波分量将得到有效的提升,非常适合石墨烯检波器的研制。由于在太赫兹频段对器件材料稳定性、低损耗的高要求,传统硅基材料已经不能满足需求,石墨烯则表现出独特的电学和物理特性。目前,对于石墨烯非线性器件的
学位
金融科技与数字经济共同推动新一轮商业银行渠道革命,加速进入全渠道协同时代。全渠道协同能力直接影响客户体验、金融服务供给能力、运营效率和成本,是商业银行竞争成败的关键。本文全面分析金融客户对金融服务的深刻影响以及数字化对渠道的革命性影响,在此基础上设计商业银行全渠道协同的战略规划,并进一步提出全渠道协同的对策建议。
期刊
目的:探究补虚降火方治疗复发性口腔溃疡的临床疗效。方法:选取2021年5月—2022年4月本院接诊的复发性口腔溃疡疾病者44例作为研究对象,采用就诊序列号单双分组法将患者分为对照组与观察组,各22例,分别予以常规西药治疗及中医补虚降火方治疗,对比两组临床疗效。结果:治疗前两组中医症状积分对比,差异无统计学意义(P>0.05);观察组经治疗中医症状积分显著偏低(P<0.05)。观察组治疗总有效率高于
期刊
2019年被世界公认为5G元年,随着国内的各大通信运营商陆续推出5G套餐,标志着我国5G正式商用。5G将给整个物联网领域带来新的改变和发展活力,如智慧城市、车联网及智能交通等领域。在5G时代,海量设备的接入使传统集中式云计算的时延抖动、吞吐量以及网络带宽等性能瓶颈越发明显,而这些瓶颈难以突破。因此引入边缘计算,其又称为移动边缘计算(Mobile Edge Computing),简称MEC。边缘计算
学位
非正交多址接入技术(Non-Orthogonal Multiple Access,NOMA)作为5G通信中的关键技术之一,近年来受到了工业界和学术界的广泛关注。通过在发送端使用叠加编码技术和接收端使用串行干扰消除技术,NOMA技术可以显著提升系统的频谱效率和用户公平性等。无人机(Unmanned Aerial Vehicle,UAV)通信具有移动性、灵活性和视距传播等特点,未来的通信更注重个性化的
学位
目的:探究利妥昔单抗在特发性膜性肾病(IMN)患者中的应用效果,及其对尿蛋白水平、血清抗M型磷脂A2受体(PLA2R)抗体、中性粒细胞明胶酶相关脂质运载蛋白(NGAL)的影响。方法:选取我科2018年9月—2020年12月收治的107例特发性膜性肾病患者作为观察对象,采用随机数字表法将其分为两组,对照组53例给予他克莫司治疗,观察组54例给予利妥昔单抗治疗,对比两组患者24h尿蛋白定量、血液生化指
期刊
步态识别是指通过识别行人的行走姿势进行身份验证的技术。与需要近距离接触的指纹、掌纹等生理特征不同,步态作为一种行为特征,具有非侵犯性高、伪装性低和远距离识别等特点。因此,步态识别在各个领域具有广阔的应用前景。本文研究了基于嵌入式GPU硬件平台的人体步态识别。为了减少复杂背景对步态特征提取的干扰,提出了一种基于姿态估计的步态特征提取方法;为了提高跨视角的步态识别准确率,提出了一种基于胶囊网络的步态特
学位
随着现代信息科技的不断发展和进步,交通工具的更新和运用速度也正在不断地提高和加快,汽车仪表的功能也日趋丰富。汽车仪表是驾驶者了解汽车正常运行的最大助力,可以为驾驶者的驾驶和安全提供技术支持。为了给驾驶员提供更舒适的操作界面以及修补一些错误,汽车仪表在使用中进行一些升级工作是很有必要的。当今社会,汽车仪表利用网络进行升级也是一个重要的方式和方法,汽车仪表的升级会有很多的发展方向,但利用网络技术实现汽
学位
植物叶片是植物机体的重要组成部分,也是植物进行光合作用的重要场所。植物叶片的参数信息能有效的反映植物的发育情况,体现环境对植物生长变化的影响。在植物学研究中,通常是以植物叶片信息为依托,制定高效的生产和培育方案,因此高效准确地测定叶片参数对于植物研究有着至关重要的意义。但是,现有的植物叶片测量主要以人工测量方法为主,存在测量误差较高、效率较低的情况,这些不利于大量和重复性的对叶片信息进行采集和处理
学位
机动车的飞速增长带来了诸多交通安全问题,道路上频频发生的肇事逃逸现象受到了社会广泛关注。深度学习的出现,在车辆的检测和跟踪方面取得了十足的发展,为人们解决相关的交通安全问题带来了新智慧。为保障交通安全问题,打击肇事逃逸现象,本文以深度学习的车辆检测和车辆跟踪等理论算法为基础,结合实际的应用场景,针对目前算法检测速度不够理想,难以兼顾速度和精度的问题,采用了检测速度快、模型体积小的YOLOv5算法,
学位