概念语音转换中的声学建模与文本生成方法研究

被引量 : 0次 | 上传用户:lijx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成旨在使计算机模仿人类的言语表达能力,具体包括文语转换(Text-to-Speech)和概念语音转换(Concept-to-Speech)等。文语转换旨在将输入的文字转换成自然流畅的语音。但人类不仅能朗读文本,还能根据头脑中的概念遣词造句并将句子通过言语讲出来。要使计算机具备这种言语表达能力就需要依靠概念语音转换。概念语音转换将抽象语义表示转换为可懂的、表达该语义的语音波形。建立一个概念语音转换系统可以通过级联自然语言生成(Natural Language Generation)与文语转换(Text-to-Speech)模块实现,前者将抽象语义转换为表层文本,后者将文本转换为语音。但目前概念语音转换领域的研究共识是需要在简单级联的系统中增加一个特别的韵律符号预测模块,该模块利用生成文本过程中产生的各类语言学信息预测韵律符号,并期望依靠这类“正确”的语言学信息提高韵律符号预测精确度。这一方法体现了系统模块间信息共享的思想,但概念语音转换不同模块之间的信息共享的途径不止如此。本文研究概念语音转换中基于模块问信息共享的声学建模与文本生成方法。首先,本文将自然语言生成模块提供的语言学信息传播到基于隐马尔科夫模型(Hidden Markov Model, HMM)的统计参数语音合成模块当中,以优化系统的声学建模能力,降低声学特征预测误差;其次,本文利用语言学信息取代韵律特征用于声学建模,以克服传统方法中韵律符号预测不精确以及韵律模型构建代价高的问题;最后,本文研究结合合成质量评估的文本生成方法,通过对输入语义对应的多个备选文本合成语音的质量进行自动评估,优化文本生成结果,提高输出合成语音的自然度。整篇文章安排如下:第一章为绪论,将从人类的言语表达能力出发介绍概念语音转换,并将其与文语转换进行对比。本章也将介绍国内外概念语音转换的研究现状。第二章将具体介绍结合外部韵律模型的中文概念语音转换系统结构,以及各个模块的原理、实现方法。具体包括中文自然语言生成、中文韵律建模以及基于HMM的统计参数语音波形生成方法。这一系统也将作为中文概念语音转换基线系统。在此基础上,本章将分析基线系统的不足。第三章将针对基线系统的不足介绍第一种优化方法。该方法将自然语言生成模块提供的语言学信息加入到统计声学模型的上下文标签中,从而为声学模型聚类提供更多可能的组合方式。实验证明加入语言学信息能够提高语音基频建模的精度。第四章将进一步介绍结合语言学特征的声学建模优化方法。该方法一方面使用语言学信息替代声学模型上下文标签中的韵律特征,另一方面提出了增加跳转的HMM声学模型结构。两者相结合,可以使概念语音转换系统摆脱对韵律特征的依赖。实验表明该方法在实际环境中能够取得与传统方法相当或更好的合成语音质量。第五章将讨论结合合成质量评估的文本生成方法,该方法首先利用规则将输入语义转换为意思相同但措辞不同的多个备选文本,然后使用基于K-NN的合成音节可接受度自动评价方法对备选文本对应中的音节逐个进行评价,进一步使用基于规则的整句可接受度评价方法对备选文本对应的合成语音质量进行自动评价。最终选择评价质量较好的备选文本作为文本生成结果。实验结果表明该方法可以提升输出合成语音的自然度。第六章将总结全文,并讨论中文概念语音转换值得深入研究的后续工作。
其他文献
本文认为,"本后示范"时期高职院校为了更好地服务于区域经济发展、地方产业升级和企业技术创新的需要,应以内涵式发展为切入点,重视优化内在属性,以不断提升自身的办学水平与
选取预计困难气管插管的患者60例,采用数字标注法随机分为两组,30例采取帝视观察内镜引导气管插管,作为DS组,另有30例采取纤维支气管镜行气管插管,作为FOB组,观察记录两组一
“立身高远频瞻望”──记民族实业家、社会活动家李烛尘晨钟李烛尘是我国著名的民族实业家、爱国民主人士、社会活动家。他的一生,始终为祖国的强盛、民族的振兴而艰苦奋斗;他
满意度的研究在目前已是一个较为成熟的研究领域,它主要用于企业、市场分析及管理中,考察消费者对产品或服务的满意程度。满意度的分析方法可运用于任何提供产品和服务的领域
在职业指导工作的探索与实践中,树立教育服务理念已经成为职业教育改革与发展的必然要求。文章基于教育服务理念,研究探讨了当前中职学校职业指导工作存在的几点问题:职业指
马铃薯是21世纪最有发展前景的高产经济作物之一,同时也是十大热门营养健康食品之一,更是确保全球粮食安全的重要基础之一。几年来,武川县马铃薯产业基本形成了规模化种植,产
目的观察帝视内窥镜引导清醒状态下气管插管和纤维支气管镜气管插管在困难气道患者中的应用及其对机体应激和不良反应的影响。方法选取2013年1月~2014年4月于上海市奉贤区中心
目的探讨改良普通喉罩辅助纤维支气管镜气管插管在困难气道患者中的临床应用效果。方法选取医院2017年6月至2018年12月收治的使用直接喉镜插管2次均失败并择期开展全身麻醉手
高功率MPCVD技术是高效率地制备大面积、高品质金刚石膜的有效方法,因为高的微波输入功率可以激发富含H原子和多种含碳基团的高密度、大尺寸的等离子体,而这正是高速率沉积大
能源危机和环境污染是当今人类面临的两大难题。如何解决以上两个问题对科研工作者提出了挑战。层状材料代表一类结构性能多样性和具有很大开发空间的二维体系,因其具有独特