论文部分内容阅读
方言辨识是语音识别技术的的一个重要研究方向。现在的语音识别系统主要研究多语种的识别技术,对属于同一语种的方言辨识方法研究较少。随着的科学技术与经济的快速发展,不同方言地区之间的交流越加频繁,因此方言辨识技术的研究与应用显得尤为重要。本学位论文研究的是朝鲜语方言辨识,是采用韵律特征和支持向量机SVM自动地判别说话人所讲朝鲜语方言语音片段所属地域的一项技术,是语言辨识技术在朝鲜语方言领域中的具体运用与实现,同时也可以作为朝鲜语语音识别的一个前期处理技术,在机器自动翻译的前端处理、多语言信息服务、人工咨询服务和言语工程学领域等方面有着广泛的应用前景。首先,根据语音是一种准周期信号的特点,将语音数据分帧并采用倒谱方法提取每帧语音的基频,在此基础上进一步提取每段语音数据的移位差分系数作为分类器的训练特征。其次,选取支持向量机SVM作为朝鲜语方言辨识的分类器,先将中国延边地区和韩国两地的方言语音数据组合为一个语音集合并提取特征,然后与朝鲜地区的方言数据提取的特征作为支持向量机SVM_SY的训练数据,再将中国延边地区和韩国两地的方言数据提取的特征作为支持向量机SVM_CH的训练数据,训练分类器。最后,以判别结果中连续3种判别结果的投票结果作为最终的分类结果,统计三种方言辨识的正确率。实验结果表明,针对朝鲜、韩国和中国延边地区等3个朝鲜语方言构成的朝鲜语方言语料库,本文提出的基于基频移位差分系数的方言辨识方法获得了92%的辨识率,有效地解决了这三种方言的语音辨识问题,验证了本学位论文所提方法的合理性和有效性。