多频带非线性分析与感知多谱熵的声带疾病嗓音识别

被引量 : 0次 | 上传用户:buzi899
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当代社会语音是人与人最自然的沟通手段,而且随着科技的发展,语音将会在人机交互等智能化领域展现出其优越性和必要性。随着环境问题、社会和职业压力等因素的出现,嗓音疾病的发病率程明显的上升趋势。声带作为重要的发声部位,其病变是导致发声出现问题的重要原因。由于无损性、便利性、易传输性等优势,声学分析的病理嗓音诊断已然成为研究的热点。针对传统声学特征在描述声带疾病对嗓音的影响时存在的局限性和非完备性,从仿生学、非线性动力学和高阶统计学角度,提出了多频带非线性分析和感知多谱熵分析的嗓音特征提取方法,以提高声带疾病嗓音的识别率。具体研究如下:(1)分析了声带疾病对嗓音信号的影响和传统特征的反映及其局限性,进行相关性和差异性分析并用于特征选择。接着提出多频带非线性分析方法,引入可模拟人耳听觉特性的Gammatone滤波器组,求取每个频带下滤波信号的最大李雅普诺夫指数,它可以细致地刻画嗓音信号每个频带的非线性特性,从而更加细致地体现出声带疾病对嗓音的非线性影响。然后提出了感知多谱熵特征,求取各听觉滤波器频带的多谱和进行能量熵分析,其可以较细致地反映嗓音每个频带的非高斯性。正常嗓音与声带疾病嗓音和声带疾病嗓音与甲状腺亢进疾病嗓音的识别实验表明本文提出的特征比传统特征有较高的识别率提升。(2)针对特征不同维间存在的冗余,采用核主成分分析进行特征优化,而核函数的形式及核参数的设置直接影响优化效果,本文提出了高斯最大似然度的最优核参数选择算法。识别实验也表明本文提出的核函数具有最佳的特征优化性能。(3)为了更全面地体现声带疾病对嗓音的影响,将筛选后的传统特征与本文提出特征融合构成新的特征向量,实现了特征之间的互补。当融合后特征用于正常嗓音和声带疾病嗓音识别系统后,平均识别率达97.83%;当用于声带疾病嗓音和甲状腺亢进病嗓音识别系统,平均识别率达80.81%。(4)最后指出了本文存在的不足和将来的工作方向。
其他文献
背景20年来,随着输尿管软镜的更新换代,提高了上尿路疾病的诊疗水平,并减少了术后复发率。但是光学纤维输尿管软镜在实际操作中暴露出视野小,清晰度低,操作不便,容易发生光线
研究目的通过对上海地区8个军队干休所在我院住院去世的离休干部进行回顾性研究,统计离休干部去世前一般身体状况、死亡原因及顺位,以及寿限和相关因素,为军队离休干部的健康指
成分血是将全血经过滤白、离心后分离出来的某一种血液成分。成分血具有浓度高、疗效好、便于保存和运输且输血反应发生率低、病毒感染风险小等优点,近年来在我国得到了广泛
C-反应蛋白在急性时相反应中出现于血清中,是一种重要的炎症标志物。近年来,由于C反应蛋白定量检测和快速检测的出现,使其临床价值得以重新发掘。因此,检测C反应蛋白对许多疾
银行作为我国国民经济发展中的支柱型行业,它是我国各项经济活动开展的重要参与者。现阶段,国内银行在理财产品方面还存在着很多不完善的地方,造成这些现象的出现主要是由于
4G时代已经来临,社会化大数据呈现几何倍数增长,流量的粗犷式经营给运营商带来了增量不增收的难题,运营商如何利用大数据资源更好的进行流量营销成为当前重要的研究课题。本
资本公积自从在我国发展起来后,就一直拥有着强大的生命力,不断的走在发展壮大的道路上,并且核算的内容也在不断的扩大范围。就目前来看,资本公积的核算内容有一部分也包含在
神经病变是尿毒症常见的并发症之一,也是死亡的重要原因。神经病变复杂,牵涉到大脑、心血管、胃肠道、泌尿生殖器等内脏及肌肉组织。其检测主要有血压、呼吸、脉搏、心率及神
1型糖尿病的发病率呈上升趋势,其发病是遗传、环境、免疫因素共同作用的结果。越来越多的研究显示1型糖尿病是一种自身免疫性疾病,其发病机制涉及免疫应答及免疫调节等免疫过
<正>随着人口的老龄化以及人们对生活质量要求的提高,由盆底功能障碍性疾病引起的临床症状需要处理的患者在不断增加,国内外的临床医生开创了许多新的手术方法,并解决了许多