论文部分内容阅读
在信息技术高度发达的今天,伴随着大数据时代的来临,人类对应用计算机处理信息的需求与日俱增。利用计算机处理语言文字一直是计算机应用领域热门的研究方向,文语转换技术(TTS)的诞生是计算机对语音文字处理的重要成果,它对文字信息进行处理,将其转换成流畅的能理解的语音信号并输出。文语转换技术在日常通讯,人机交互,人工智能等领域发挥着重要作用。对文语转换系统的研究国内外早在上世纪90年代就已经开始,并且成功的开发出了对应用相对广泛的语言的文语转换系统,如汉语、英语、法语等。在国内对部分少数民族语言的文语转换系统的开发也取得了令人瞩目的成果。藏族是我国民族体系的重要组成部分,藏族主要分布于我国西藏、青海、四川、甘肃等省,随着科学技术的发展和国家道路工程的建设,越来越多的人会选择去青海、西藏等地旅游参观,这样也加快了藏文化与其他民族文化之间的交流与融合。为了更加高效的使藏族朋友与其他民族进行文化交流,对藏文文语转换系统的研究具有重大意义和广泛的应用前景。本文主要研究工作如下:1.在对藏文结构和书写文法做研究的基础上,选择藏文音节作为基元,通过对藏文音节中每个藏文字符的特征选择和提取,构建藏文音节特征向量。2.从藏文文法出发,讨论了藏文文本中每一种音节的基字位置,并且建立了特殊基字音节库。使得系统可以准确判断藏文音节中基字的位置。3.分别构建了依据藏文音节结构的藏文音节特征向量库和依据藏文音节内字符数量的藏文音节特征向量库。通过音节特征向量在音节库中进行检索的方式解决文本识别问题。4.根据应用时的语音合成方式,建立了两种藏语语音库,分别为藏文音节语音片段库,和基于混合激励与LPC语音编码的压缩语音库。根据上述研究成果,构建了一个藏文文语转换系统。通过在MATLAB环境中实验验证,该系统在特征向量库数据充足的情况下可以正常工作。