论文部分内容阅读
我国言语构音、语音障碍患者数量较多,而相关的障碍评估方法主要以主观听觉感知为主,缺乏一定的客观性和稳定性。近年来,语音识别技术在多个领域得到了广泛的应用,在言语语言教育方面的应用研究也取得了一定成果。但是在言语障碍评估与康复研究领域,基于语音识别的相关研究成果并不多见,而且未能引起足够的重视。本研究根据国内外言语构音、语音障碍的评估方法研究现状和发展趋势,综合语音识别技术在言语语言教育中应用的研究成果,进行了言语构音障碍、语音障碍自动评估的探索性研究。本研究首先提出基于语音识别进行构音障碍自动评估的基本思想,即能够通过计算机等设备对患者的构音功能从内容、声调以及障碍类型三方面进行自动评价。为验证基于语音识别的构音障碍自动评估方法的可行性,本研究基于微软公司发布的自带识别引擎的Speech SDK开发了构音障碍自动评估可行性分析系统。通过比较使用该系统和主观听觉感知方法对3-6岁健听儿童的构音能力评估的结果,得到构音障碍自动评估可行性分析系统对全部被试的平均识别准确率达到83.5%,初步说明基于语音识别的构音障碍评估方法是可行的,但仍无法满足言语障碍评估与康复的临床实际需求。本研究也因此提出了基于改进技术方案的构音障碍自动评估方法。采用自行构建的识别引擎和微软内置的识别引擎构建“双识别引擎”的构音障碍自动评估系统。首先,本研究采用基于隐马尔科夫模型的语音识别算法,从整体平均的角度来实现最优的识别过程,在统计框架中寻找能够使模型参数最大化的词条作为识别结果。提取62名3-6岁健听儿童按照指定词表所发语音的39维参数制作标准声学模型。根据前人对听障儿童构音障碍评估的研究成果,得到普通话声母和韵母的常见构音障碍具体情况,将构音障碍产生的词条汇总成表。基于微软Speech SDK实现构音障碍类型的检测模块。最后,基于SMDSF算法提取语料的4维基频特征,制作用于实现声调识别的标准声调识别模型。效果验证包括两方面,一方面使用与构音障碍自动评估可行性分析实验相同的健听儿童语料来验证系统的识别性能,识别准确率达到98%以上;另一方面采用主观听觉感知评估与语音识别评估对比的方式,对3-5岁的听障儿童的构音能力进行评估。结果证明两种方法得到的结果没有显著性差异,四项构音清晰度指标的值基本一致,能够基本实现构音障碍的自动评估。在构音障碍自动评估系统构建的基础上,本研究通过改进识别算法提出了语音障碍自动评估系统。在自行构建的标准声学模型基础上,分别提出了《语音重复能力测验词表》和《语音切换能力测验词表》以及基于这些词表的语音障碍自动评估方法。然后,同样基于微软Speech SDK提供的具备优先识别指定词条功能的API函数,实现语音重复和语音切换的障碍检测。最后,以听障儿童为对象,采用主观听觉感知评估与构音识别评估对比的方式,对语音障碍自动评估系统进行效果验证。结果证明。语音障碍自动评估系统的评估结果与主观评估结果没有显著性差异,两种方法得到的评估指标结果基本一致,能够基本实现语音重复能力和语音切换能力的自动评估功能。