论文部分内容阅读
语音合成是语音信号处理领域的一个重要分支,其研究对人机交互、语音分析,语音编码,语音增强和语音识别等各个领域都有重要的促进作用。如今,大容量、高自然度的语音合成技术已经比较成熟,广泛的应用于声讯服务、行业企业、计算机等领域,为人们的生活带来了便利。然而,中文语音合成技术因为合成效果、系统实现、资源占用等条件的限制,在嵌入式环境下却依然没有得到广泛应用。
本文从上述几个限制了嵌入式中文语音合成应用的难点出发,着重解决嵌入式中文语音合成系统中的系统设计和移植等问题,解决嵌入式环境下的运算和尺寸资源占用问题,并同时获得了较好的语音合成效果,实现了业界领先的嵌入式中文语音合成系统。本文主要开展的工作如下:
1、采用面向对象的系统设计思路,运用统一建模语言UML为基本设计语言,运用多种嵌入式设计模式,解决嵌入式语音系统的可移植性、可配置性、可扩展性、可维护性、低资源消耗等特殊的需求,并最终采用C语言实现了基于面向对象模型的系统。
2、采用基于大语料库裁减的算法,运用数据挖掘中的聚类技术,对基础大语料库根据规则和算法进行裁减,实现了适合嵌入式环境下的高自然度的任意文本合成引擎。并针对某些特定的文本合成领域,采用有限语境矢量空间的思想实现定制合成引擎。
3、深入研究了各种嵌入式行业领域的功能需求,设计出满足车载、手机等行业应用需求的解决方案,并开发了相应的产品,在行业上已经得到了广泛的应用。