论文部分内容阅读
随着航海技术和计算机技术的快速发展,船舶导航自动化程度越来越高,但是船舶导航系统警报大都还采用机械式的声响,海员需要用肉眼观察才能得知警报的内容,在一定程度上影响了船舶的安全航行。近些年语音识别技术在航海领域的成功尝试,语音合成技术在航海领域的应用令人期待,因此本文提出将语音合成技术应用到航海领域。本文的主要目的是把船舶导航系统传统式的报警声响转换为自然语音,而且是模拟目标人的语音,目标人可以是船舶最高指挥官即船长的声音,从而实现权威性的导航语音报警。本文以基于隐马尔可夫模型的统计参数语音合成为研究基础,采用了说话人自适应的语音合成方法,通过利用四个用于训练的英文语料库,以及新构建的一个目标人英文语料库,实现了英文个性化语音合成,并成功的应用到ECDIS导航报警上。本文的主要工作内容如下:(1)建立VW Pual实验语料库,包括准备语音文件和前端文本分析。(2)在Linux系统上编译语音合成所需的工具,实现了基于单人语料库的说话人相关(SD, Speaker Dependent)的语音合成。(3)利用说话人自适应技术,实现了个性化英文语音合成。首先对四个训练人的语音数据进行说话人自适应训练,得到平均声音模型,利用约束最大似然线性回归(CMLLR, Constrained Maximum Likelihood Linear Regression)自适应算法获得与目标人相似的语音。实验测评结果表明,与SD语音合成相比,基于说话人自适应的个性化语音合成的语音与目标人VW Pual更相似,其质量也远远高于SD语音合成的语音。(4)通过Visual Studio 2010编程实现ECDIS的16种报警检测,最终在电子海图模拟器上实现了个性化语音报警。