论文部分内容阅读
语音识别是通过语言的子段单元或音素模型从而实现的,但是就目前而言基于语言学的框架的并没有多少实质性的研究成果。对于那些尚未验证的是否音系学是最终实现开放词汇,独立话者,多语种的突破点的理论而言,单从实际的角度将子段单元作为识别目标的优点已很显著。本文从提出管辖音系学理的基本理论入手,探讨这种新特征的在中文自动语音识别方向的优越性,并结合实验针对十个汉语孤立字完成自组织神经网络的建模和训练识别。主要工作包括以下两大部分:一.GP基本理论和中文语音单元的GP表征研究:1)GP理论认为所有语言的语音最终都可以被分解为一系列的基本单元,称为基元。这些基元可以单独构成也可以以组合的形式构成。每一个基元对对应其本身独特的声波标记图,而这个标记图是不随着语言不同和说话者不同而变化的。2)本文结合中文的语言特点,根据已有的汉语英语音素对应关系,总结并得出中文语音单元所对应的GP表示,为进一步的实验提供数据训练准备。二.基于GP特征表达的十个汉语孤立字的自组织神经网络的构建和训练识别1)自组织竞争神经网络的选取、特性和优点:网络结构简单,适合小词汇孤立字识别,所需训练数据较少,实时性比较好。2)基于MATLAB7.0的自组织神经网络的构建,训练和识别。包括十个9维样本向量的转化和预处理,训练样本向量的选取,网络建立和训练,测试向量的转化,和最终网络的测试并在误差允许的范围内取得较好的识别效果。从以上的分析论述,我们可以得出结论,GP理论在语音识别领域中具有十分广阔的发展前景,并且随着英语体系下GP理论的不断完善和发展,其在中文方面的应用也同样具有广阔的发展前景,并必将开拓汉语语音识别的一个全新的领域。