嵌入式汉语合成语音库的构建与搜索

来源 :山东大学 | 被引量 : 0次 | 上传用户:wujian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于大语料库的语音合成方法,由于能够产生高自然度的合成语音,成为目前应用较多的语音合成方法。高质量的大语料库合成系统对存储资源和运算能力要求比较高,从而限制了它的应用范围,主要用在服务器级和桌面级。随着嵌入式技术的不断发展,嵌入式语音技术的应用已成为必然的趋势。但是,嵌入式系统存储容量和处理能力均有限,从而限制了语音合成技术在嵌入式系统中的应用。所以,如何解决大语料库语音合成系统的合成效果和资源消耗之间的矛盾,使语音合成技术在嵌入式领域中应用就成为一个亟待解决的问题。本文针对嵌入式设备存储容量小、计算能力有限的特点,对基于变形决策树(CART)模型和改进K-中心聚类算法的语音库构建和合成基元搜索方法进行了研究。该方法可以有效的选出原始语音库中最具代表性的基元样本,从而合理有效的降低语音库的规模和算法复杂度,满足嵌入式设备的要求。首先,以带有声调的音节为基元,采用基于变形CART模型的预分类方法对大容量合成语音库进行预分类,并对语音库中音节种类、总数等相关数据做统计分析;然后,分别以带有声调的音节、声韵母为基元,以基频、时长和Mel频率倒谱系数等为特征,采用改进K-中心聚类算法进行不同比例的聚类裁剪,得到尽量覆盖原始语音库中韵律情况且满足嵌入式系统资源要求的语音库;最后,利用裁剪后的语音库以及改进的合成基元搜索算法,搭建出语音合成系统。通过主观听辨实验和客观数据计算,对语音库裁剪和合成基元搜索算法进行验证。实验结果表明,裁剪后系统的合成语音具有较好的清晰度、自然度。
其他文献
利用NCEP/NCAR再分析资料和我国地面观测站的逐日降水资料,研究了2007年夏季淮河流域洪涝与亚洲地区大气低频振荡的联系,通过分析研究表明:2007年夏季淮河流域降水低频振荡的
由于在不同工业领域总线技术的竞争,形成了不同总线标准并存的局面,实现各种总线之间的设备互联和互操作成为了系统集成技术急需解决的问题,因此对异构网络可编程设备互操作技术
一种新型环境友好型半导体材料β-FeSi2以其优越的性能在光电、热电及光伏等领域的应用引起了人们的广泛关注。β-FeSi2的组成元素Fe、Si在地壳中的含量非常丰富,且β-FeSi2的
组蛋白乙酰转移酶(HATs)在真核生物的基因转录调控和响应外界刺激的过程中起着重要作用。水稻中的OsHATs包含8个成员,分属于以下四个蛋白家族:CBP家族(OsHAC701、OsHAC703和Os
相对于单天线系统,多天线MIMO(Multiple Input Multiple Output)系统无需耗费额外的功率或者带宽便可以成倍地提高系统容量,因而受到了越来越广泛的关注。本文在Ultra Wide Ban
全球气候变化问题的紧迫性以及世界各国对制定适应性政策的需求促使气候变化适应性科学的发展。原住民气候变化适应性研究是理解影响适应性关键因素以及提供相关政策建议的有
歧义图是一种非常奇妙的视觉图像,它指的是一个图像可以产生两个截然不同的有意义的知觉图形,知觉到的图像在两个稳态图形间转换。双稳态知觉现象因此成为知觉研究的良好模式,但
发光中心的自发辐射寿命是光电材料一个重要性能参数,它不仅与发光中心内在性质有关,还依赖环境介质的折射率。自发辐射寿命在不同情况下遵从不同的模型。现存在的两个主要模
学位
存储器在半导体市场中占有重要的地位,仅DRAM(DynamicRandomAccessMemory)和FIASH两种就占市场的15%,随着便携式电子设备的不断普及,不挥发存储器市场也越来越大。然而传统的不挥
目的:  胰腺癌尤其是胰腺导管腺癌,早期诊断困难,恶性程度极高,预后极差,是目前癌症死亡的第四大原因。2015年我国新发胰腺癌103428例,其中超过85%的胰腺癌起源于导管细胞,约80%的胰