论文部分内容阅读
语音合成技术,简称TTS(TexttoSpeech)是让机器模拟人类讲话的语音输出技术,以此提供一种信息的语言表达方式。随着微处理器性能的提升、信号处理技术的进步、移动互联网的发展,语音合成技术已经取得了突破性的研究成果,尤其是中文的语音合成技术在国际上达到了领先地位并开始广泛地应用到各个领域当中。将TTS技术与当今社会应用广泛的嵌入式技术融合为一体已经成为语音合成领域研究的热点。文章作了以下几个方面的工作:首先文章详细综述了语音合成的发展历史、国内外研究现状、语音合成原理、系统框架的组成部分。重点分析了隐马尔可夫(HMM)参数合成原理,并在此基础上对嵌入式硬件平台和软件平台Android系统分别设计了独自的语音合成系统。硬件平台采用安凯AK1050处理器芯片,使用AK1050配套的Spotlight软件平台为开发环境,对基于HMM语音合成算法进行ARM移植,进行语音合成芯片的设计。该语音合成系统通过PC机VB开发的简单人机交互界面进行获取用户输入的文本信息继而通过串口把数据传输到语音合成芯片上,经过AK1050处理器的处理把文本信息转换为语音数据流播放出来。对于基于Android的语音合成系统的设计以三星Cortex-A8内核的S5PC100处理器的Android开发板为主。在Android系统硬件抽象层中进行语音合成系统的移植最终以动态库的形式给应用层提供语音合成API接口。并在Android应用层开发了一个简单的APK应用程序用作人机交互,用来实现获取用户输入的文本信息并将文本信息传递给硬件抽象层的动态库进行语音流的转换,最终通过调用Android系统内部的音频播放接口进行语音播放。文章最后对全文进行了总结,分析了现有设计的不足,在此基础上提出了对语音合成系统硬件方面、软件方面的改进方案。