论文部分内容阅读
基于语音识别的旅游用语言检索翻译系统,是一个以语音识别为技术支持,旅游翻译系统为应用背景,机器翻译为目标的应用研究。
在语音识别技术方面,本论文提出了一种基于仿生模式识别的新的模式识别方法,即基于矢量量化的仿生模式识别。仿生模式识别是一种先认识,后划分的模式识别,区别于传统的先戈分再识别的模式识别,它能做到单模板识别,大大降低了误识率。仿生模式识别模拟人类认识事物的过程,对不能识别的样本,做到了拒识,因此从某种程度上提高了识别率。且相对于语音识别中常用的隐马尔可夫HMM模型,它的识别速度较快,算法易于运行,便于在手机等小型通用设备上集成。为了易于系统的集成,本文在特征选取上,对传统的特征量进行了变换,使用算法速度较快的特征进行样本训练,提高了系统整体的运行速度。
在翻译系统方面,由于真正的机器翻译是集语音识别、机器翻译、语音合成为一体的,由于语种复杂多变,种类繁多,目前机器翻译仍旧是科技界的一大难题。所以本文提出的语言检索翻译系统,是在语音识别技术的基础上,通过数据库的检索,来达到关键语意翻译的目的。且本文的系统是应用于旅游,因此也大大降低了数据库中词汇的容量。现今,旅游已成为人们休闲度假的首选,日益增多的旅游胜地,多语种的交流使得语言沟通成为一大问题。如果能够用手机等便携设备实现翻译,那将大大减少人们旅途中语言的障碍。因此本文提出的所有技术,包括识别方法,特征提取的变换,数据库语言检索都是基于能够让系统易于集成这个目的。
本论文的主要工作集中在以下几个方面:1.对语音识别预处理中的语音端点检测,提出了一种新的方法,它使用图像处理来检测语音端点,并结合传统的检测方法,提高了端点检测的精度。2.对语音识别的特征进行了改进,在使用传统特征参数的基础上,增加了特征变换,在保证特征精确度的前提下使算法的速度加快。3.通常的连续语音流中关键词识别采用的HMM(隐马尔克夫模型)来进行模式识别,本文根据仅仅提取关键词这一特点,采用了基于矢量量化的仿生模式识别的方法,对样本群先识别再划分,而不是传统意义上的直接样本划分,提出了具体算法,从而提高了识别率。最后介绍了翻译系统,针对目前直接翻译不能实现,本文采用了语言检索的方法来实现关键语意的检索翻译。