论文部分内容阅读
字 -音转换是语音合成系统中的一个重要模块 ,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题。本文通过对大量标注有正确拼音的语料的统计 ,指出着重解决 4 1个重点多音字和 2 2个重点多音词就可基本解决字 -音转换的问题。本文采用基于扩展的随机复杂度的随机决策列表方法自动提取多音字 (词 )的读音规则 ,将字 -音转换的错误率由 8 8‰降低到 4 4‰。规则的训练和测试的材料的标注是一个耗费人力和时间的工作 ,而训练材料的数量和质量又直接影响最终的结果。本文提出一种半自动的语料标注流程 ,可以节省将近一半的人工和时间