英文文语转换中韵律生成与字音转换研究

来源 :同济大学电子与信息工程学院同济大学 | 被引量 : 0次 | 上传用户：df781111

【摘要】

：

本论文的工作以一个基于大语料库的英文文语转换(TTS)系统的开发为背景，针对英文TTS系统中的韵律生成及字音转换中的一些关键问题展开研究，其中字音转换更是本文研究的重点。主

【作者】

：

王永生

【机构】

：

同济大学

【出处】

：

同济大学电子与信息工程学院同济大学

【发表日期】

：

2006年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本论文的工作以一个基于大语料库的英文文语转换(TTS)系统的开发为背景，针对英文TTS系统中的韵律生成及字音转换中的一些关键问题展开研究，其中字音转换更是本文研究的重点。主要内容和研究成果如下： 1.词性标注：由于词性信息是韵律生成和字音转换研究的基础，因而必须先解决词性标注问题。本文提出了一种基于决策树的词性标注的非监督学习算法，该算法以一个词库和一个未进行词性标注的语料库为基础，通过上下文中没有词性歧义的词来分类有词性歧义的词。 2.语调短语边界的预测：语调短语边界的预测是韵律生成模块的重要组成部分。本文先根据语音库的实际停顿标注出其中的中间短语和语调短语，然后以该语料库为基础，提出一种基于转换式学习法的语调短语边界预测的学习算法，并辅之以标点符号约束规则及语调短语音节数约束规则。 3.字音转换：英文的字音转换非常复杂，本文将之拆分成3步，即字素切分、字素/音素转换及重音标注。对于字素切分问题，本文提出了一种名为有限泛化法(FGA)的机器学习算法来进行字素切分规则的学习。然后将FGA进一步改进为动态有限泛化法(DFGA)，以用于字素/音素转换规则的学习。与FGA 相比，DFGA学习的对象是动态的，包括前缀、后缀及一般字素与音素的转换；属性的数目是动态的，最少为3个，最多为8个；此外，属性的位置也是动态的。 4.重音标注：仅仅将英文单词中的字母转换成音素还是不够的，只有在标注完重音后，才能形成完整的音标。由于主重音的重要性要远远大于次重音，并且主重音的情况要比次重音简单，因而本文将主重音和次重音分开进行标注。对于主重音的标注提出了一种基于形态规则与机器学习方法相结合的算法，对于一些可直接借助其形态结构来判别主重音的情况，制定主重音标注的形态规则；而对于一般的词，则通过转换式学习法进行机器学习。由于次重音的情况更为复杂，基本上无法通过形态结构来判别次重音的位置，因而直接通过转换式学习法进行学习。 5.音节切分：由于音节是基于大语料库的英文TTS系统中一个重要的拼接单元，因而必须将合成文本中所有单词的音标切分成音节。本文提出了一种基于约束树的音节切分算法，通过应用形态规则约束、韵律规则约束及音位规则约束进行音节切分。在实施音位规则约束时，提出了一种基于音位结构树的子算法。 6.多音词消歧：一般而言，多音词可分成两类，一类是因词性不同而读音不同，另一类是因词义不同而读音不同。前者的消歧比较简单，只需对合成文本进行词性标注，根据多音词的词性标记就可以选择正确的读音。而后者的消歧就复杂得多，本文提出了一种基于WordNet语义信息的多音词消歧算法，该算法将多音词的语义信息与上下文中词的语义信息进行加权匹配，根据匹配结果来判别多音词的读音。上述各种算法和研究成果，均已在我们所开发的英文TTS系统中得到实现和检验。实验表明，合成语音的可懂性和自然度均有了显著的提高。关键词：英文文语转换，韵律边界预测，词性标注，字音转换，音节切分，多音词消歧

其他文献

基于CAN总线的分布式系统的时钟同步算法研究

随着计算机日益深入地走进人类的工作生活中，信息技术和网络技术得到了越来越广泛的应用。其中许多关系国计民生的重要应用领域，需要依靠计算机系统的高可靠性和高效率来精确控

学位

CAN总线分布式系统协商算法时钟同步算法阶段分割

基于ARM嵌入式工业控制器的研究与实现

嵌入式系统是一种面向具体应用的将底层硬件、实时操作系统和应用软件相结合的专用计算机系统。其广泛应用于控制领域、消费电子产品等行业，已成为现代电子领域的重要研究方向

学位

嵌入式ARMμC/OS-ⅡlwIP工业控制器

基于多传感器行为融合基础上的AGV导航研究

移动机器人是机器人学中的一个重要分支,其主要目标是研究在复杂环境下机器人系统的实时控制问题,涉及到任务规划、运动规划与导航、目标识别与定位、机器视觉、多种传感器信

学位

AGV避障行为融合导航模糊神经网络超声波传感器

视频监控系统的设计与实现

随着计算机性能、网络带宽的提高和视频编解码技术的发展,视频的应用日趋广泛。但是,如何完成高质量的视频流任务仍面临诸多挑战:如何在通用的操作系统上满足视频流的实时性

学位

流媒体Directshow视频监控SocketProtel DXP服务器多线程

大惯性温度传感器的数值模拟

为解决高温、强浸蚀介质、强热震性等恶劣条件下的温度测量难题，目前较普遍采用的方法是在感温元件上外加一层、甚至两层保护套管，致使实测温度总是滞后于被测温度的变化，产生动

学位

温度传感器数值模拟有限元分析传热模型共轭梯度法温度测量钢水测温反演算法

电磁逆散射正则化算法的研究

电磁逆散射是利用未知物体的电磁散射信号重建物体形状和结构的一类问题，广泛存在于生物医学工程、无损检测、地球物理、模式识别等诸多应用领域。由于该未知物体的特性参数与

学位

电磁逆散射迭代方法正则化算法共轭梯度法小参数Tikhonov方法

基于贝叶斯滤波理论的移动机器人定位与地图创建研究

移动机器人的定位与导航是移动机器人领域的关键技术，定位问题是机器人真正自主化和智能化研究中最为重要的一个基本问题。基于传感器的定位是当前移动机器人领域非常活跃的研

学位

移动机器人自定位地图创建全向视觉贝叶斯滤波

不同类别约束多智能体系统分布式优化与控制

学位

无轴承永磁同步电机优化设计与转子不平衡补偿研究

无轴承电机以其无摩擦、无磨损、无需润滑和密封等一系列优良特性，在能源交通、航空航天及机器人等高科技领域具有广阔的应用前景。与磁轴承支承的电机相比，无轴承电机具有一些独特的优点，1)径向力绕组叠压到电机的定子绕组上，不占用额外的轴向空间，电机轴向长度可以设计的较短，临界转速可以非常高；与磁轴承电机相比，在转轴长度一定的情况下，电机的输出功率得到大幅度的提高。2)电机的结构更趋简单，维修方便，特别是电

学位

无轴承永磁同步电机质量不平衡无轴承电机振动控制有限元ANSYS

智能假肢开发与关键技术研究

目前，康复机器人已经成为国际机器人领域的一个研究热点。由于战争、疾病、工伤、交通事故及意外伤害等原因，致使数以百万的人失去下肢，人们迫切希望通过假肢恢复截肢者的行走功

学位

智能假肢优化设计多体系统建模磁流变液阻尼器膝关节力矩控制虚拟样机

英文文语转换中韵律生成与字音转换研究

与本文相关的学术论文