论文部分内容阅读
口语翻译系统是当前口语系统的研究领域中一个热点问题。口语翻译系统通过计算机实现从一种自然语言的语音到另一种自然语言语音的自动翻译,具有非常广阔的应用前景。本文结合开发旅馆预订领域的口语翻译系统的课题背景,详细介绍了口语翻译系统的体系结构和口语语音识别器的建立方法。针对汉语口语翻译的特点和对现有翻译技术的分析,本文采取了多个翻译引擎协同工作的体系结构。根据旅馆房间预订这一主题,收集了一批语料,并在对语料分析的基础上建立了1162词的词典。本文为应用于旅馆房间预订领域的口语翻译系统建立了语音识别器。针对汉语口语的特点,识别器采用了基于HMM的声学模型,基于词和基于词类的混合统计语言模型,及由语言模型引导的词树Viterbi-Beam搜索,并且采用基于音节的填充模型、话语确认和拒识等方法对集外词、非语声和噪音进行处理。在识别器建立的过程中特别注意了识别器的模块化和领域可移植性。对识别器的测试显示识别器的性能达到了口语翻译系统的要求。