病理嗓音修复算法的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhufeng19791123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类传递信息最直接的方式。近年来,发声器官器质性或神经性的病变使得嗓音疾病发病率越来越高,嗓音含混不清会影响人们的沟通效率,采用非侵入式的信号处理方式对病理嗓音进行修复,能提高受损语音的可懂度,提高人们的沟通效率。此外,病理嗓音修复在语音识别、机器导航、语音增强、语音通信系统、军事刑侦和隐蔽监听等领域都有着很广泛的应用前景。本文以提高病理嗓音可懂度为目标,设计实现了一套完整的病理嗓音修复系统,具体完成的工作如下:
  (1)分析发声系统的原理,为研究病理嗓音形成机制提供理论基础。通过发声系统的数学模型对激励模型、声道模型和辐射模型进行详细地介绍。针对发病率高的声带息肉嗓音信号,从时域、频域的角度分析其声学特性,并从短时和长时两方面分类总结声学特征,高效地对病理嗓音信号进行特征分析。研究提高病理嗓音识别率的算法。针对传统声学特征对病理嗓音识别率低的问题,提出一种E-BLSP参数的病理嗓音识别算法,将E-BLSP特征和其他传统参数(LPCC、MFCC)输入到SVM和DNN网络中,研究单一特征和融合特征在两种分类器下的识别性能,准确率、ROC等多个客观指标的评价结果均验证了该算法的有效性。
  (2)研究激励模型中反映韵律特性的激励参数,针对传统算法提取病理嗓音基频失效的问题,提出一种基于小波变换和HHT变换的算法,准确提取病理嗓音基频信息;研究声道模型参数和元音类型、发声音色的关系,针对病理嗓音信号共振峰出现偏移、不稳定等问题,基于LSP参数,参照正常嗓音参数特性对病理嗓音进行迭代修复,实现对病理嗓音声道特性的重建;研究基于不同合成规则的语音合成算法,基于修复后的基频参数和声道参数选择线性预测参数合成法进行病理嗓音再合成;研究评价语音质量的指标,针对修复前后的嗓音信号,分别从时域测度、频域测度和听觉域测度评价病理嗓音修复系统的性能。实验结果表明,本论文实现的病理嗓音修复系统在语音可懂度方面取得了令人满意的效果。
其他文献
日本沼虾作为中国重要的淡水经济虾类,具有重要经济价值。对沼虾健康养殖的需求促使关注其免疫防御和抗逆性机制。当生物暴露于病原微生物、重金属等各类胁迫环境时,体内的应激蛋白如金属金属硫蛋白(metallothionein,MT)和热休克蛋白(heat shock protein,HSP)等往往会上调表达,以帮助宿主对抗有害刺激,维持内环境稳态。甲壳动物的MTs和HSPs属于两个大的基因家族,在抗逆过程
学位
该文采用蒙特卡罗方法(MCS)对气体电子崩的发展进行模拟.该文分析讨论了随机变量和随机数对蒙特卡罗模模型的收敛性、精度和误差的影响;改进了计算单一气体电子崩放电的蒙特卡罗模拟方法;提出了计算混合气体电子崩发展的蒙特卡罗模型;并对蒙特卡罗方法计算电子崩发展的特点以及应用前景进行了探讨.蒙特卡罗方法直接模拟大量电子在电场中的电子崩发展过程,其计算结果的准确性直接取决于截面的选取和校正.采用校正后的碰撞
学位
压缩感知(Compressive Sensing,CS)理论作为一种新的数据获取框架,其优势是从低维的观测值中重建高维的稀疏(或可压缩)数据,降低采样成本。观测矩阵与观测值的生成、数据重建精度密切相关,是CS理论的一个重要研究方面。经典随机矩阵的高计算复杂度和其随机结构与一些实际应用领域的不一致性,使得结构化观测矩阵的研究日益受到关注。尽管结构化观测矩阵的研究取得了一些成果,但在一些实际领域出现的
视频中的异常行为分析在交通监控、社会安防等领域有着广泛的应用,近年来已经成为计算机视觉研究的热点之一。本文针对视频中运动目标的轨迹信息提取和异常行为分析开展研究。运动物体的轨迹能够提供目标运动行为模式的宏观信息,而且与视频数据相比,轨迹信息易于储存、传输和分析,尤其适于交通场景下的长时间车辆监控。因此,本文以运动目标的轨迹作为行为的主要表征,研究异常行为分析的几个关键技术问题。一方面,研究用于视频
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)遥感与光学遥感相比,能够全天时、全天候、全地域进行实时数据采集,成像效果不受时间、气候和地域的影响。同时,合成孔径雷达成像分辨率与目标距离无关,在国防和民生方面具有非常重要的作用。由于其相干成像机制,合成孔径雷达图像中不可避免地会产生斑点噪声。斑点噪声是一种依赖于观测信号的颗粒状噪声,是相干成像系统中固有的噪声,相干斑的存在降
随着对海洋资源环境越来越多地开发利用,人们对海洋信息的采集要求不断提高,测量船作为信息采集设备的主要载体,对其航行控制,尤其是航迹控制,也提出了更高的要求。自动舵是实现航迹保持的主要设备,在测量船航行过程中,由于受到海上环境的干扰,会偏离预先设定的航线,此时需要自动舵装置控制船舶改变航向,使船回到规定的航线上,这样测得的数据才是我们预期中想要得到的数据。  近年来,人工智能技术发展迅速,应用也越发
低频微振动在我们日常生活中、工业领域中随处可见,如生命体征监测、桥梁楼宇质检、地震监测等。但是,对低频微震动的测量参数获取比较复杂和困难,其被测对象形貌复杂,振动频率通常在几个赫兹范围,振动幅度在毫米,甚至亚毫米级别。因此,传统的接触式测量方法具有一定的局限性。为了实现快速、精确的全场振动测量,非接触式光学图像测量方法提供了一种合适的解决方案。非接触式光学图像测量方法是通过振动信号对图像特征点的像
学位
雾霾天气下拍摄的图像存在细节模糊、色彩偏移、低对比度等问题,严重影响户外视觉系统发挥效用。因此,雾霾图像清晰化研究具有重要的理论意义和应用价值。论文根据雾天图像成像特点,针对目前基于统计先验和基于学习方法去雾后图像易出现颜色失真、细节模糊及噪声放大等问题,提出了新的见解和方法。论文主要工作如下:  首先,为了避免图像去雾后细节模糊和噪声放大,将图像分解为结构层和纹理层,并只对其结构层进行去雾。基于
学位
随着计算机的普及和数字图像处理技术的进步,计算机视觉技术得到了飞速的发展,利用深度学习的方法进行目标检测与识别,较传统的目标检测与识别方法,实现了自动化、智能化和高效化,且具有更高的检测识别精度。  红外图像与可见光图像相比较而言,其抗干扰能力更强,红外图像的目标检测变得越来越重要,尤其是在军事领域和恶劣环境下。然而现如今,目标检测技术主要集中在可见光图像领域,可见光图像与红外图像成像原理不同,因
学位
目标检测是计算机视觉中最具挑战性的问题之一,其目的是检测图像中特定目标的位置,已广泛用于人脸识别、自动驾驶、行人检测、视频监控等领域。基于深度学习的方法由于其无需进行人工特征设计、具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流。针对特征金字塔网络易丢失细节和检测速度慢等问题,本文提出了高效轻量化特征金字塔网络及其目标检测算法。主要工作如下:  与基于图像金字塔的目标检测方法相比
学位