论文部分内容阅读
计算机文-语转换技术(Text-to-Speech,简称TTS)指利用计算机程序将既定的可视文本信息转换成语音的过程。这一系统广泛地涉及了语言学、语音学、计算机编程、数字信号处理等领域,是一门综合了多学科多领域的技术项目。我们接触的拼音输入法、图书拼音排序检索、各种音序排序、汉语的语音教学软件的运用、各类电子产品的语音朗读功能的改进、自动介绍或者答复系统以及盲人用品和儿童玩具的开发、甚至包括机器人制造以及未来语音操控系统在各领域的实现,都离不开这一技术手段。作为一项高度要求理论性与实用性相结合的技术,TTS在产生之初就备受各学科学者的高度重视。如何提高TTS系统中语音合成的流畅度、自然度与准确率成为这一技术必须关注的焦点。其中,汉语多音字读音自动标注的准确率更成为文-语转换技术的难点之一。本文的研究对象在于,确定《现代汉语词典》(第5版)(以下简称《现汉》)中921个多音字及其音项在CCL现代汉语语料库中的语用频率,以字频为基础,进而从语言学理论的角度出发,为TTS处理中多音字问题的解决提出一种新思路。文章的主要内容包括三个部分,第一部分,对《现汉》中多音字的数目进行统计,确定以921个多音字为研究对象,并对每个多音字的词性及进行统计。第二部分,在CCL现代汉语语料库中对这921个多音字的字频进行语用频率统计。根据统计结果和累计频率的计算,最终将这些多音字分出高、中、低三个频级。对各频级的多音字每个音项的使用频率进行统计,分出高频音、低频音两个音级,对在语料库中只占1%的低频多音字采用常读音默认的方法进行处理。第三部分,对中、高频多音字进行分类,综合运用多音节词排除法、词性确定法和附带常用多音字词库法等方法进行处理。对那些各音项语用频率相当、词性区别不明显的可独立成词的多音字,则逐条梳理其所有语料,总结其出现的语境,为多音字构建规则。